有A和B兩位籃球運動員,都認為自己的三分球投籃技術比對方好,誰也不服誰。于是兩人來了一場投籃友誼賽。規則很簡單,固定一個投籃位置,使用同一只籃球,面對同一個籃框,在沒有任何外力干擾的情況下,兩人分別各投10次,計算命中率。
很快,比賽結束,結果出來了。A命中5次,命中率50%;B命中3次,命中率30%,依照比賽規則,A獲得了勝利。但是B很不服氣,認為自己沒有把真正的實力發揮出來,要求再加賽一輪,第 一輪不作數。A也覺得可以再加賽一輪,他要讓B輸得心服口服。于是,兩人又加賽了一輪,每人各投了10次。
第 二輪結果出來了,A命中6次,命中率60%,B命中了7次,命中率70%,根據這輪的結果,應該是B獲勝。這下輪到A不干了,A說不應該只看第 二輪的成績,應該把兩輪的數據匯總起來作比較。A兩輪一共投籃20次,命中11次,命中率55%;而B命中10次,命中率50%,總的來說,還是A獲勝。B卻不這么認為,B覺得既然加賽一輪,就應該只看第 二輪的數據,應該是自己獲勝才對。
于是,現在有了如下的三組數據。
只看第 一輪,A獲勝;只看第二輪,B獲勝;看兩輪匯總,又是A獲勝。
那么到底應該根據哪組數據來給出結論呢?
A和B兩人爭執不下,于是一起找到了教練評理。教練看了看數據,說道:“判斷比賽誰獲勝比較簡單,看兩次的數據匯總最合理,可以判定A獲勝。但是,要說A的投籃水平一定比B高,這個結論暫時還不好下,因為你倆的數據很接近,而且投籃的數量太少。這樣吧,我來組織一場比賽,你倆交替各投5輪,每輪20次,每人共100次,你倆誰水平高我們就用這個數據說話。”
于是在教練的組織下,A和B按照新規則完成了比賽,得到了以下數據。
教練拿著數據,打開電腦一頓操作,然后微笑著對A和B說:根據假設檢驗的結論,我現在有足夠的信心判定,A的投籃水平比B的水平要高一些。A和B都表示認可這個結論,但齊聲問道:什么是假設檢驗?這么神奇,還能幫人下結論?
那么,什么是假設檢驗?
來自百度百科的定義:
假設檢驗(hypothesistesting),又稱統計假設檢驗,是用來判斷樣本與樣本、樣本與總體的差異是由抽樣誤差引起還是本質差別造成的統計推斷方法。顯著性檢驗是假設檢驗中最常用的一種方法,也是一種最基本的統計推斷形式,其基本原理是先對總體的特征做出某種假設,然后通過抽樣研究的統計推理,對此假設應該被拒絕還是接受做出推斷。
這個定義是不是看起來晦澀難懂?其實我們對照上面的案例,就好理解了。首先理解總體和樣本的概念。在案例中,我們把某人的投籃水平看成是總體,這個總體包含了TA之前、現在和未來的投籃結果,那么每次比賽,都可以理解為一次抽樣,而每次比賽中投籃的次數就是一個樣本。在最新一次的比賽中,A和B的樣本數量都是100,而A的命中率44%,高于B的30%,如果單看樣本,可以說本次比賽A比B命中率高,但我們希望通過樣本來說明總體,也就是A和B的水平(能力)的比較,這時候下結論就需要謹慎了。會不會B這次的30%只是他實際能力的正常波動呢?他的平均水平會不會更高甚至高于A呢?
我們可以通過假設檢驗來回答我們的疑問。
我們先給出一個假設:A的水平高于B,然后來檢驗這個假設是否成立。打開Minitab軟件,進入“統計”-“基本統計量”-“雙比率”,把比賽數據輸入:
點“選項”,因為我們要檢驗的假設是“A水平高于B”,所以將“備擇”更改為“大于”:
點“確定”,返回再點“確定”,我們就得到了下面的一段文字。
這段文字反饋了很多信息,對于初學者而言,我們只需要看懂最后一行的P值就可以了。本案例中的P值為0.028,也就是2.8%。這個2.8%是個概率,告訴我們如果我們相信前面提出的假設,即“A水平高于B”而判斷失誤的可能性為2.8%,這是個很低的概率,一般情況下,這個數低于5%時我們就可以有足夠的信心下結論了,因為判斷錯誤是個低概率事件。所以,教練才會信心十足的宣布:A的投籃水平要高于B。
我們再用之前兩輪的匯總數據做一下假設檢驗:
得到以下的結果:
這時的P值高達50%,如此高的判斷失誤概率,難怪僅憑這些數據教練無法做出判斷。
說到這里,相信大家對假設檢驗有了一個基本概念了。那么,在工廠的實際工作中,假設檢驗有哪些用武之地呢?那就有很多啦!最典型的有以下三個應用時機:
1. 判斷某些因素是否是影響結果的真因時;
2. 在改善措施導入后確認目標是否達成時;
3. 判斷生產制程是否出現異常而導致明顯偏差時。
由于篇幅所限,本文中就不展開講解假設檢驗在工廠中的具體應用了,想深入學習的朋友可關注優制咨詢的精益六西格瑪系列精品課程。
——END——
版權聲明:本文為優制咨詢精益生產咨詢師原創文章,轉載請注明出處。