关于统计过程控制中样本组数量的研究

2012-09-26 09:12
统计与决策 2012年19期
关键词:点子稳态准则

康 军

0 引言

统计过程控制(Statistical Process Control简称SPC)是应用统计技术对过程中的各个阶段进行评估和监控,建立并保持过程处于可接受的且稳定的水平,从而保证产品与服务符合规定的要求的一种质量管理技术。统计过程控制理论一是利用控制图分析过程的稳定性,对过程存在的异常因素进行预警;二是计算过程能力指数(Cp和Cpk)分析稳定的过程能力满足技术要求的程度,对过程质量进行评价。SPC在推动工业生产过程的改进、生产率的提高和产品质量的改善等方面都起到了巨大的推动作用。通过实施SPC,可以实现过程的可控性、可度量性、可预测性。

1 问题的提出

统计过程控制的核心是控制图,控制图的绘制基本可以分为两个过程,首先是分析用控制图绘制阶段;其次是控制用控制图阶段。分析用控制图的主要目的是寻找过程的稳态,即过程只有偶然因素没有异常因素的状态,判断过程是否达到稳态的依据是判稳准则,这种稳态称为统计稳态;然后再根据技术标准和技术要求判断过程是否达到技术稳态,当过程同时达到统计稳态和技术稳态时,即认为过程处于受控状态,此时将分析用控制图的控制限延长作为控制用控制限(主要适用于常规控制图),进入控制用控制图阶段。控制用控制图阶段的目的是保持过程的稳态,利用判异准则来判断过程是否处于异常,如果出现异常,立即进行现场分析、查找异常原因,使过程回归稳态。

经过上述控制图的绘制步骤可以发现,首先需要绘制分析用控制图,判断过程是否处于稳态。绘制控制图的过程包括收集样本数据、计算控制限、作图、分析等几个主要步骤,其中收集样本数据时又包括样本组数量和组内样本量两个指标,一般组内的样本量为4~6(根据过程的稳定性进行确定,无论过程是否接近正态分布,经证实组内4~6个样本量已能保证Xbar的分布接近正态分布)。样本组主要反映组间差异,所以应达到一定的数量,以充分反映组间差异,然而,我们在对控制图的学习过程中,发现了在绘制分析用控制图时,不同的文献中对样本组数量的要求是不同的,分别有20组,25组,20~25组之间和35组等几种不同的情况,这对控制图的学习和使用带来了困惑,以下是国内常见的质量管理学教材和参考书的统计结果(以常用的的均值-极差控制图为例)。

1. 1 抽取20组

《质量管理学》(第3版)(龚益鸣、蔡乐仪、陈森编著,复旦大学出版社(2010))第240~241页,例2中,取“ 20组数据”绘制Xbar-R图。《工业工程典型案例分析》(蒋祖华、奚立峰等编著,清华大学出版社(2005))第197页中,“绘制分析用控制图,抽取20组以上的数据”。

1. 2 抽取20~25组之间

《质量管理》(Howard S.Gitlow著,张杰等译,机械工业出版社(2008))第159页例子中则给出抽取了22组数据(每组6个数据);国家标准GB/T4091-2001《常规控制图》中规定选取20~25组。《理工科概率统计》(美)(Ronald E.Walpole等著,周勇等译,机械工业出版社(第8版))第502页中“抽取k个样本,其中k不少于20。每个样本容量通常较少,如取4,5或6”;在第509页的例17.2中,则取了25个样本。

1. 3 抽取25组

《质量管理学》(第3版)(孙静主编,高等教育出版社,第196页中,“收集25组大小为4或5的子组”。《QS9000参考手册学习与理解——统计过程控制》(王霄锋编著,清华大学出版社)第43页中,“在控制图上采用25个或更多个子组”。《质量工程师手册》(张公绪、孙静主编,企业管理出版社)第337页中“至少取25组”。《机械工业质量管理教程》(张维德主编,刘源张主审,机械工业出版社)第566页例22-4中,选取“25组样本”。《注册质量工程师手册》(美国质量协会著,克劳士比中国学院译,中国城市出版社)第412页)中“需要收集并记录25个或更多小组数据(每组4或5个数据)”。《统计质量控制Statistical Quality Control》(Seven edition,Eugene L.Grant,Richard S.Leavenworth著,清华大学出版社影印版(2002))第44页说明“至少取25个子组”。

1. 4 抽取35组:

《接近零不合格过程的质量控制》(孙静著,清华大学出版社)第55页,“Xbar-R控制图的操作步骤的步骤2:取预备数据。①根据对判稳准则的分析,至少应取35组样本”。《两种质量诊断理论及其应用》(张公绪著,科学出版社(2001))第43页,“步骤2:取预备数据。①根据判稳准则(2),至少取35组”。

对同一理论有不同的取样结果,这样就给实际使用带来了困惑,所以就带来了问题——基于过程控制的目的,样本组的数量应该是多少最合适呢?

2 统计过程控制状态的理论分析

统计过程控制状态,也称稳态,即过程中只有偶然因素没有异常因素。稳态是生产追求的目标,在稳态下:对产品的质量有完全的把握,通常控制图的控制限都在规格界限内,故在稳态下至少有99.73%的产品是合格品。用统计学来描述即为,由于控制图是基于正态分布的(即使过程不是正态分布,但根据中心极限定理——大量的独立随机变量之和具有近似于正态的分布)可以得出独立随机变量的均值Xˉ服从正态分布N(μ,σ2),即Xˉ~N(μ,σ2)),那么Xˉ处于[μ-3σ,μ+3σ]范围内的概率为99.73%,处于该范围外的概率为(1-99.73%)=0.27%,而落在大于(μ+3σ)或小于(μ-3σ)一侧的概率为0.27%/2=0.135%。即如果过程处于统计控制状态(即没有异常因素),应至少有99.73%的数据在控制限内,而落在控制限任何一侧的数据则只有0.135%的可能性。根据小概率事件原理,如果有点子出界,则可以判断过程出现异常,所以就得出最基本的判异准则“点出界就判异”。

在控制图中,如一个点子落在控制限内,是否可以判断过程处于稳态呢?一种情况是,过程处于稳态,此时点子落在界内的概率为99.73%,另一种情况是,过程出现异常,但是却发生了漏发警报的错误,此时出现界内点的概率为β(称为第二类错误或漏发警报错误),但无论是哪种情况,都不再是小概率事件了,无法做出过程处于稳态的判断,所以根据一个界内点不能立即判断过程处于稳态。如果接连出现m个点子都未出界,则情况大不相同,这时m个界内点出现漏发警报的概率为βm=βm,要比一个点子落在界内的漏发警报概率β小得多,于是根据小概率事件原理,可以判断过程处于稳态。如果接连落在控制界内的点子更多,则即使有个别点子偶然出界,过程仍可判断为稳态,这就是判稳准则的设计思想。

2. 1 控制图稳态的判稳准则

判稳准则主要用于判断过程是否处于稳态,除了最基本的准则“点出界就判异”外,还包括,在点子随机排列的情况下,符合下列条件之一的过程判断为稳态(简称为判稳准则):

连续25个点,界外点数d=0;

连续35个点,界外点数d≤1;

连续100个点,界外点数≤2。

针对该判稳准则,各个文献都是一致的,区别在于,对于同样的判稳准则,不同的文献中对样本组数的抽取是不同的,有20组,25组,20~25组之间和35个样本组的差别。

2. 2 判稳准则的α分析

判稳准则用以对随机现象进行判定,故也可能发生两种错误(即第一类错误α和第二类误β),根据上述判稳准则,分别计算各自的α错误(也称显著性水平)。连续25个点,界外点数d=0;

α1=1-P(连续25点,d=0)

连续35个点,界外点数d≤1;

α2=P(连续35点,d>1)=1-P(连续35点,d≤1)=1-0.9959=0.0041

连续100个点,界外点数≤2

α3=P(连续100点,d>2)=1-P(连续100点,d≤2)(0.9973)98(0.0027)2}=1-0.9974=0.0026

上式表示,在过程正常的情况下,连续35点出现d>1是小概率事件,它实际上不发生,若发生即判断过程不稳,α2就是执行该判稳准则时犯第一类错误的概率,也称为显著性水平。其余依次类推。

这里需要注意的是,α1=0.0654比α2=0.0041和α3=0.0026要大得多,比控制图中点出界的概率0.0027大一个数量级,所以,该判稳准则中犯第一类错误的可能性大增。据此有国外的专家建议取消该判稳准则。

通过上述计算,解释了样本组取25组和35组的原因,即接近控制图设计时的第一类错误α=0.0027,也就是小概率事件原理。

但为何有的文献中又取20组样本呢?同样对第一类错误α进行计算。

α4=1-P(连续20点,d=0)=1=1-0.9474=0.0526

与α1=0.0654比较接近,处于同一数量级。所以,基于该原因,部分文献中抽取20组样本进行过程的稳态判断。优点是样本量少,可以节约取样成本,尤其是针对一些破坏性的测试。但是,既然第一类错误α基本相同,为什么判稳准则中只规定“连续25个点中,界外点数d=0”,而没有规定“连续20个点中,界外点数d=0”呢?

3 样本组数量的研究

子样数的大小应满足“组间差异大,而组内差异应小”的原则。从过程角度来看,收集越多的子样可以确保变差的主要原因有机会出现。一般情况下,包含100个或更多单值读数或更多子样可以很好地用来检验稳定性。如果过程已稳定,则可以得到过程位置和分布宽度有效的估计值。样本收集的越多,所经历的时间越长,所以越能体现出样本组之间的差异,即符合“组间差异大,而组内差异应小”的要求,这样能够反映出过程的波动问题。在第一类错误α基本一致的情况下,为了保证组间变差的出现,应尽可能多的收集样本组,这就是在综合考虑准确性和经济性的前提下,采用了25组样本组而不是采用20组样本组的原因。同样的,由于第一类错误α1=0.0654和α4=0.0526是基本一致的,所以在保证相同准确度的同时,为减少抽样成本,部分文献中也采用了20组样本进行过程稳态的判断。

无论是25组还是20组样本组,其第一类错误的概率α1=0.0654和α4=0.0526均比0.0027要高一个数量级,与统计过程控制设计时的α=0.0027有较大差异,所以会有部分国外专家提出要取消“25组中,d=0”的判稳准则。但由于该判稳准则一直沿用了较长时间,且基本能够满足对过程控制的要求,所以该准则仍保留至今。

随着技术和经济的进步、产品结构的复杂和对可靠性要求的提高,尤其是对零缺陷和卓越绩效的追求,组织的过程控制能力要求越来越高,通过过程来保证产品质量的理念越来越深入人心。为了减少过程中发生第一类错误的风险,降低对生产过程和产品的影响,满足顾客要求,追求顾客满意,对过程质量的控制应采取较严格的控制。根据上述分析计算,建议在分析用控制图阶段采用“35组样本中d≤1”作为判稳准则,理由是:首先该判稳准则是在严格的数学计算的基础上,符合控制图设计的3σ控制限的思想,即第一类错误α=0.0027,35组样本中d≤1的概率0.0041接近0.0027。其二是该判稳准则同时兼备了两种情况,即“点出界就判异”和“连续点子中部分点子出界”。控制图的基本准则是“点出界就判异”,当35点中出现1个界外点时,首先检查过程是否出现异常还是虚发警报,如果是过程出现异常导致的点子出界,对过程中的4M1E因素进行调整,使过程回归稳态;如果过程没有异常,仅仅是虚发警报的问题,则可以判断过程处于正常。在该判稳准则下,如果没有点子出界,则表明过程处于正常状态,如果点子出界,则需要对进行过程进行仔细的分析,所以该准则是一个比较稳健的准则,即既考虑了点出界的情况,又确保点出界仅是虚发警报,对过程质量的判断是极为谨慎的。这对分析用控制图是至关重要的,在该阶段采取了谨慎的做法,确保过程是稳定的,对后续控制用控制阶段,能够确保过程是稳定的,即为过程的稳态判断提供了“双保险”。另外,抽取较多的样本组,能够较好的反应组间的情况——组间差异,如果较长时间内组间没有差异,则说明过程是持续稳定的。所以以“35组样本中d≤1”是值得推荐的一种判稳准则,可以较全面的反应过程质量。同时由于分析用控制图的目的是先判断过程是否达到稳态以及将过程调整为稳态,然后进入过程控制阶段,所以分析用控制图阶段体现的是事前控制而不是事后控制的思路,体现的是源头控制的思想。尽管从表面看来似乎多抽取了10组样本,提高了抽样成本,但是从“确保过程稳态、减少判断失误带来严重后果”的角度来分析还是合适的。最后,尽管判稳准则“100个样本组中d≤2”犯第一类错误的概率α3=0.0026最接近0.0027,但是其样本量太大,且对两个样本出界情况的分析要复杂得,费时较长,所以不推荐在分析用控制图阶段优先采用该准则。

“35组样本中d≤1”的准则只适用于过程控制的分析阶段,即分析用控制图阶段,不适用于控制用控制图阶段。从数学的角度看,分析用控制图阶段就是过程参数未知的阶段,而控制用控制图阶段则是过程参数已知的阶段。既然参数已知,那么只要用样本统计量与参数进行对比即可。这时使用的是判异准则而不是判稳准则,对样本组数是没有要求的。这时是一个实时过程,只要出现了判异准则中的情况,即可判断过程出现异常,进行问题查找、原因分析,解决问题,使过程重新回到受控状态,实现过程的控制。

4 局限性

上述分析都是基于减少第一类错误α的风险,该风险一般也称为生产方风险。但随着“以顾客为关注焦点”等质量管理原则的贯彻,在过程质量控制时更应该考虑使用方风险,即第二类错误β,或者考虑造成的“社会成本最小”。鉴于传统的统计过程控制理论较为完善和使用范围较广,所以本文仍以控制第一类错误α为主,这是本文的局限所在。

[1]龚益鸣,蔡乐仪,陈森.质量管理学(第3版)[M].上海:复旦大学出版社,2010.

[2]蒋祖华,奚立峰等.工业工程典型案例分析[M].北京:清华大学出版社,2005.

[3]孙静.质量管理学(第3版)[M].北京:高等教育出版社,2011.

[4]王霄锋.QS9000参考手册学习与理解——统计过程控制[M].北京:清华大学出版社,2004.

[5]张公绪,孙静.质量工程师手册[M].北京:企业管理出版社,2005.

[6]张维德.机械工业质量管理教程[M].北京:机械工业出版社,2008.

[7]美国质量协会.注册质量工程师手册[M].克劳士比中国学院译.北京:中国城市出版社,2003.

[8]Howard S.Gitlow(霍华德S吉特洛).质量管理[M].张杰等译.北京:机械工业出版社,2008.

[9]国标GB/T4091-2001《常规控制图》[S].

[10]孙静.接近零不合格过程的质量控制[M].北京:清华大学出版社,2001.

猜你喜欢
点子稳态准则
可变速抽水蓄能机组稳态运行特性研究
碳化硅复合包壳稳态应力与失效概率分析
电厂热力系统稳态仿真软件开发
元中期历史剧对社会稳态的皈依与维护
好点子不足以支撑好买卖
廉洁自律准则歌
点子摇滚怪杰 Dan Deacon 12月启动中国巡演
学学准则
一图读懂《中国共产党廉洁自律准则》
新审计准则背景下审计教学面临的困境及出路