| 導購 | 订阅 | 在线投稿
分享
 
 
 

質量管理中統計區間的意義與應用

2008-11-05 12:27:45  編輯來源:互聯網  简体版  手機版  移動版  評論  字體: ||

學過一點統計質量管理或有過六西格瑪管理培訓經曆的人都知道「統計區間Statistical Interval」的概念,有的還在實際工作對其有所應用。但根據筆者的觀察發現,絕大多數工程技術人員對這個統計概念的理解似是而非,導致根據統計推斷做出的判斷與實際情況相悖,産生了不必要的質量損失。更有甚者,由于認識上的明顯偏差,對于同一組數據,不同的人用各自認爲正確的統計分析方法,得出了截然相反的結論,雙方因此爭論不休,大大降低了工作效率。這些現象顯然違背了我們「由數據驅動,用量化的方法進行客觀公正的決策」的初衷,因此有必要對這一概念做一個全面明確的闡述,並結合實際介紹如何有效地應用統計區間。

總體而言,統計區間分爲三類:置信區間Confidence Interval,預測區間Prediction Interval,容忍區間Tolerance Interval。相對而言,置信區間是大家最熟悉的,但它的真正含義是什麽?預測區間和容忍區間又有什麽作用?讓我們用一個實際案例來說明吧。

背景介紹:假定您在一個生産同軸電纜的公司負責質量管理工作,有一種主要産品的規格是:目標值=50歐姆,標准差=2歐姆。從上月(六月份)生産的所有産品中隨機抽取了40個電纜並測量其阻值,發現此樣本的平均值=49.86歐姆,標准差=1.96歐姆(具體分布參見用專業統計分析軟件JMP制作的圖一)。除了已經獲得的樣本統計量,您還能提煉出什麽信息呢?對于下列問題,您會如何解答呢?

圖一 同軸電纜的樣本信息

1. 如果以總體均值作爲衡量質量的指標,六月份産品的總體均值可能是多少?總體質量水平又大致如何?

2. 在已知六月份質量水准的情況下,能否預測下個月(七月份)生産1個同軸電纜,電阻會是多少?生産10個同軸電纜,電阻均值又會是多少?

3. 樣本中電阻的最小值、最大值可以直接讀取,那麽占六月份所有産品99.73%的産品電阻的波動範圍該如何預測?

問題1

置信區間可以用來解釋類似「問題1」類型的問題。置信區間是用樣本信息來估算表示總體參數(如平均值)的不確定程度的。一般情況下,總體平均值的置信區間可以用下列公式表示:

由上式可見,置信區間的取值範圍是在樣本均值(即總體均值的估計值)的基礎上增加一定比例的誤差構成的,而誤差值是由樣本大小n、t分布的分位數和樣本標准差s(即總體標准差的估計值)決定的。具體地,我們可以用JMP軟件快速計算出置信區間的大小,結果如圖二所示。

圖二 同軸電纜的置信區間

由圖二可知,95%的均值置信區間的下限爲49.23,上限爲50.49。也就是說,我們認爲所有六月份産品的電阻均值有95%的可能性落在[49.23歐姆,50.49歐姆]的範圍之內。因爲這個範圍內包含了目標值50歐姆,所以我們有95%的把握相信六月份的産品質量與目標還是很接近的。

問題2

預測區間可以用來解釋類似「問題2」類型的問題。預測區間是用已經發生事件的樣本信息來估算表示未來發生事件的參數(如單個值、平均值)的不確定程度的。一般情況下,總體未來平均值的預測區間可以用下列公式表示:

由上式可見,預測區間的定義公式和置信區間很相似,只是取值範圍更大一些。原因很簡單:預測區間需要考慮置信區間不用考慮的預測噪音。同樣,我們可以用JMP軟件快速計算出預測區間的大小,結果如圖三所示。

圖三 同軸電纜的預測區間

由圖三可知,當未來事件數爲1時,95%的均值預測區間的下限爲45.84,上限爲53.88;當未來事件數爲10時,95%的均值預測區間的下限爲48.46,上限爲51.26。也就是說,我們有95%的把握認爲:如果七月份生産1個同軸電纜的話,産品的電阻值將落在[45.84歐姆,53.88歐姆]的範圍之內;如果七月份生産10個同軸電纜的話,産品的電阻均值將落在[48.46歐姆,51.26歐姆]的範圍之內。

問題3

容忍區間可以用來解釋類似「問題3」類型的問題。容忍區間是用樣本數據來估算表示指定比例的總體上下限(而不是平均值)的不確定程度的。一般情況下,總體的容忍區間可以用下列公式表示:

由上式可見,容忍區間的定義公式前兩者有較大不同,使用了相對比較複雜的g函數,具體的數學推導過程在此不做介紹,只是強調其值與置信度?、指定比例p和樣本大小n密切相關。我們依然用JMP軟件快速計算出容忍區間的大小,結果如圖四所示。

圖四 同軸電纜的容忍區間

由圖四可知,置信度爲95%、指定比例爲99.73%的容忍區間的下限爲42.52,上限爲57.20。也就是說,我們有95%的把握認爲:所有六月份産品的電阻有99.73%落在[42.52歐姆,57.20歐姆]的範圍之內。

通過上述案例的演示,我們可以比較清晰地了解置信區間、預測區間和容忍區間這三個容易張冠李戴的統計概念的現實意義以及各自適用的場合。筆者謹以此抛磚引玉,希望越來越多已經建立精細化管理意識的工程技術人員無論是在日常的質量改進工作,還是在六西格瑪項目的實施中,都能夠在明確問題實質的前提下,選用最具針對性的統計工具更加精准地揭示産品或流程的客觀規律。

本文之所以選用JMP作爲實現載體,是由于一般的統計軟件只能實現置信區間之類的初級計算,無法滿足預測區間和容忍區間等高級統計區間的深入應用,專業質量管理統計分析軟件JMP能完整地實現上述統計概念的分析應用。出于統計分析的整體一致性和長期發展性的考慮,筆者運用JMP軟件做了統一格式的分析說明。希望讀者在專業統計分析工具的幫助下,也能享受到現代化統計分析給我們帶來的輕松和快樂。

學過一點統計質量管理或有過六西格瑪管理培訓經曆的人都知道「統計區間Statistical Interval」的概念,有的還在實際工作對其有所應用。但根據筆者的觀察發現,絕大多數工程技術人員對這個統計概念的理解似是而非,導致根據統計推斷做出的判斷與實際情況相悖,産生了不必要的質量損失。更有甚者,由于認識上的明顯偏差,對于同一組數據,不同的人用各自認爲正確的統計分析方法,得出了截然相反的結論,雙方因此爭論不休,大大降低了工作效率。這些現象顯然違背了我們「由數據驅動,用量化的方法進行客觀公正的決策」的初衷,因此有必要對這一概念做一個全面明確的闡述,並結合實際介紹如何有效地應用統計區間。 總體而言,統計區間分爲三類:置信區間Confidence Interval,預測區間Prediction Interval,容忍區間Tolerance Interval。相對而言,置信區間是大家最熟悉的,但它的真正含義是什麽?預測區間和容忍區間又有什麽作用?讓我們用一個實際案例來說明吧。 背景介紹:假定您在一個生産同軸電纜的公司負責質量管理工作,有一種主要産品的規格是:目標值=50歐姆,標准差=2歐姆。從上月(六月份)生産的所有産品中隨機抽取了40個電纜並測量其阻值,發現此樣本的平均值=49.86歐姆,標准差=1.96歐姆(具體分布參見用專業統計分析軟件JMP制作的圖一)。除了已經獲得的樣本統計量,您還能提煉出什麽信息呢?對于下列問題,您會如何解答呢? 圖一 同軸電纜的樣本信息 1. 如果以總體均值作爲衡量質量的指標,六月份産品的總體均值可能是多少?總體質量水平又大致如何? 2. 在已知六月份質量水准的情況下,能否預測下個月(七月份)生産1個同軸電纜,電阻會是多少?生産10個同軸電纜,電阻均值又會是多少? 3. 樣本中電阻的最小值、最大值可以直接讀取,那麽占六月份所有産品99.73%的産品電阻的波動範圍該如何預測? 問題1 置信區間可以用來解釋類似「問題1」類型的問題。置信區間是用樣本信息來估算表示總體參數(如平均值)的不確定程度的。一般情況下,總體平均值的置信區間可以用下列公式表示: 由上式可見,置信區間的取值範圍是在樣本均值(即總體均值的估計值)的基礎上增加一定比例的誤差構成的,而誤差值是由樣本大小n、t分布的分位數和樣本標准差s(即總體標准差的估計值)決定的。具體地,我們可以用JMP軟件快速計算出置信區間的大小,結果如圖二所示。 圖二 同軸電纜的置信區間 由圖二可知,95%的均值置信區間的下限爲49.23,上限爲50.49。也就是說,我們認爲所有六月份産品的電阻均值有95%的可能性落在[49.23歐姆,50.49歐姆]的範圍之內。因爲這個範圍內包含了目標值50歐姆,所以我們有95%的把握相信六月份的産品質量與目標還是很接近的。 問題2 預測區間可以用來解釋類似「問題2」類型的問題。預測區間是用已經發生事件的樣本信息來估算表示未來發生事件的參數(如單個值、平均值)的不確定程度的。一般情況下,總體未來平均值的預測區間可以用下列公式表示: 由上式可見,預測區間的定義公式和置信區間很相似,只是取值範圍更大一些。原因很簡單:預測區間需要考慮置信區間不用考慮的預測噪音。同樣,我們可以用JMP軟件快速計算出預測區間的大小,結果如圖三所示。 圖三 同軸電纜的預測區間 由圖三可知,當未來事件數爲1時,95%的均值預測區間的下限爲45.84,上限爲53.88;當未來事件數爲10時,95%的均值預測區間的下限爲48.46,上限爲51.26。也就是說,我們有95%的把握認爲:如果七月份生産1個同軸電纜的話,産品的電阻值將落在[45.84歐姆,53.88歐姆]的範圍之內;如果七月份生産10個同軸電纜的話,産品的電阻均值將落在[48.46歐姆,51.26歐姆]的範圍之內。 問題3 容忍區間可以用來解釋類似「問題3」類型的問題。容忍區間是用樣本數據來估算表示指定比例的總體上下限(而不是平均值)的不確定程度的。一般情況下,總體的容忍區間可以用下列公式表示: 由上式可見,容忍區間的定義公式前兩者有較大不同,使用了相對比較複雜的g函數,具體的數學推導過程在此不做介紹,只是強調其值與置信度?、指定比例p和樣本大小n密切相關。我們依然用JMP軟件快速計算出容忍區間的大小,結果如圖四所示。 圖四 同軸電纜的容忍區間 由圖四可知,置信度爲95%、指定比例爲99.73%的容忍區間的下限爲42.52,上限爲57.20。也就是說,我們有95%的把握認爲:所有六月份産品的電阻有99.73%落在[42.52歐姆,57.20歐姆]的範圍之內。 通過上述案例的演示,我們可以比較清晰地了解置信區間、預測區間和容忍區間這三個容易張冠李戴的統計概念的現實意義以及各自適用的場合。筆者謹以此抛磚引玉,希望越來越多已經建立精細化管理意識的工程技術人員無論是在日常的質量改進工作,還是在六西格瑪項目的實施中,都能夠在明確問題實質的前提下,選用最具針對性的統計工具更加精准地揭示産品或流程的客觀規律。 本文之所以選用JMP作爲實現載體,是由于一般的統計軟件只能實現置信區間之類的初級計算,無法滿足預測區間和容忍區間等高級統計區間的深入應用,專業質量管理統計分析軟件JMP能完整地實現上述統計概念的分析應用。出于統計分析的整體一致性和長期發展性的考慮,筆者運用JMP軟件做了統一格式的分析說明。希望讀者在專業統計分析工具的幫助下,也能享受到現代化統計分析給我們帶來的輕松和快樂。
󰈣󰈤
王朝萬家燈火計劃
期待原創作者加盟
 
 
 
>>返回首頁<<
 
 
 
 
 熱帖排行
 
王朝網路微信公眾號
微信掃碼關註本站公眾號 wangchaonetcn
 
 
靜靜地坐在廢墟上,四周的荒凉一望無際,忽然覺得,淒涼也很美
© 2005- 王朝網路 版權所有