摘要:统计过程控制图(Statistical Process Control Chart)是一种用于监控生产过程稳定性的统计工具。通过绘制数据点在时间序列上的分布,帮助识别过程中的异常变化。统计控制图可实时监控生产过程是否处于统计控制状态,及时发现过程中的异常波动和
统计过程控制图(Statistical Process Control Chart)是一种用于监控生产过程稳定性的统计工具。通过绘制数据点在时间序列上的分布,帮助识别过程中的异常变化。统计控制图可实时监控生产过程是否处于统计控制状态,及时发现过程中的异常波动和趋势,为持续改进提供数据支持,以及可在问题发生前进行预警。SPSSAU中共支持9类统计控制图,分别是:Xbar-S/Xbar-R/Xbar/I-MR/I, P/NP/C/U图。涉及到连续(定量)和离散(定类)两种数据类型,如果是连续数据时区分是否包括子组两种数据格式,如果有子组数据则应该使用Xbar-S/Xbar-R/Xbar,如果没有子组数据则应该使用I-MR/I图,如果是离散(定类)数据,应该使用P/NP/C/U图。具体选择使用可参考下图:
如果是监控连续性数据,那么应该选择Xbar-S/Xbar-R/Xbar/I-MR/I,继续区分数据格式,如果是子组数据那么应该选择Xbar-S/Xbar-R/Xbar,反之如果是单值数据则选择I-MR/I图。进一步似子组大小和监控目的而定,如果子组较少关注均值变异性,那么使用Xbar-R图,如果子组较大监控变异图可使用Xbar-S图,如果仅仅监控均值,那么使用Xbar图即可。单值数据并且关注数据波动时可使用I-MR图。
当数据是离散性,似监控对象而定,当关注不合格品时使用NP/P图,如果关注缺陷数则使用C/U图。进一步判断单位信息情况,比如基数大小固定时使用NP图(关注不合格品数),反之使用P图(关注不合格品率)。基数大小固定时可使用C图(关注单位内缺陷数),反之使用U图(关注缺陷率)。
质量控制图案例
1、理论
SPSSAU提供九类质量控制图,该九类的汇总说明,如下表所示:
如果是连续数据,并且子组数据格式,则应该选择使用Xbar-S/Xbar-R/Xbar图,并且结合子组大小和监控目的进一步进行选择。如果是连续数据并且是单值数据则应该使用I-MR或I图。当是离散数据时,可使用P/NP/C/U图,进一步判断,如果是单位基数固定和不固定两种情况,一种是监控‘数’,一个是监控‘率’,比如NP和C图分别关注不合格品数和单位缺陷个数,而P图和U图分别 关注不合格率和单位缺陷比率。
以及关于9种控制图的数学计算公式,分别如下述:
1) X̄-S图(均值-标准差图)
如果每次取的样本比较多(通常10个以上)时,用标准差比极差更准确。因为极差只看最大最小值,其忽略掉中间数据的变化,而标准差考虑了所有数据点。均值就是平均数,假设每次取5个零件测量长度,得到5个数据,把这5个数加起来除以5就是均值。
计算公式上:对于每组数据,先算出某组的平均值(均值),然后把所有组的均值再平均一次,得到总均值即控制图的中心线。同样,把所有子组的标准差平均一次,得到平均标准差。控制限就像是"警戒线",超出这条线就要注意了。以及下述中会提及A2、A3、B3、B4、D3、D4等这些SPC系数来计算控制限,这类系数是统计学家根据大量数据总结出来的标准值,不同的样本数量对应不同的系数。均值数和标准差图的控制限计算分别如下述:
2) X̄-R图(均值-极差图)
X̄-R是最常见的控制图,适合每次取2-10个产品进行测量的情况。比如每小时从生产线上取5个零件测量尺寸,或者每批次取4个产品检测重量。
极差是最大值减最小值,假设每次取5个零件测量长度,得到5个数据,该5个数据的最大值的减去最小值的就是极差。
计算公式上:对于每组数据,先算出某组的平均值(均值),再算出最大值与最小值的差(极差)。然后把所有组的均值再平均一次,得到总均值即控制图的中心线。同样,把所有组的极差平均一次,得到平均极差。以及其控制限的计算说明分别如下述:
3) X̄图(仅均值图)
如果只关心平均水平,不太在意波动大小时使用。或者当过程的变异性已经很稳定,不需要再监控时,此时可只使用均值图。
计算公式上:计算各组数据的平均值,然后画成图表。控制限的计算需要借助极差或标准差的信息,或者使用已知的过程标准差。以及控制线计算如下述:
4) I-MR图(单值-移动极差图)
如果每次只能得到一个测量值的情况,比如每天测一次温度、每批测一次pH值等。由于没有多个数据来计算极差,所以用"移动极差"的概念。移动极差就是相邻两个数据之间的差值。比如今天测得25度,昨天是23度,移动极差就是|25-23|=2度。
计算公式上:
5) I图(仅单值图)
I图仅监控单个测量值,其计算较为简单,如下述:
6) P图(不合格品率图)
如果关心不合格品占总数的比例时使用,比如客户投诉率、产品缺陷率等。样本大小可以变化,比如这批检查了100个,下批检查了120个。
计算公式上如下述:
如果每次检查的数量都相同,关心不合格品的绝对数量时使用。比如每天都检查100个产品,看有多少个不合格。
计算公式如下:
计算公式上如相:
9) U图(单位缺陷数图)
计算公式如下:
10) 关于SPC控制系数表
针对SPC控制系数列,如果n小于25时,SPSSAU使用上表格,如果n>25时,SPSSAU会自动进行额外计算,其计算公式如下:
当样本量n>25时,d2系数通过伽马函数积分法计算,即:d2(n) = √2 × Γ((n+1)/2) / Γ(n/2),d2系数用来将极差转换为标准差的估计值。当样本量超过25时,查表法不够精确,需要用数学积分公式来精确计算。这个公式基于统计学理论,通过伽马函数(Gamma函数)来描述极差分布的数学特性。
当样本量n>25时,d3系数通过近似公式计算:d3(n) = 0.886 / √n,d3系数用来计算极差本身的标准差。当样本量很大时,这个系数会随着样本量增加而减小,遵循"样本量越大,估计越稳定"的统计学原理。0.886是一个经过大量统计验证的常数,就像物理学中的重力加速度9.8一样,是通过理论推导和实验验证得出的固定值。
当样本量n>25时,c4系数通过伽马函数计算:c4(n) = √(2/(n-1)) × Γ(n/2) / Γ((n-1)/2),c4系数用来修正标准差的偏差,让标准差的估计更准确。在统计学中,直接计算的标准差往往会偏小,需要用c4系数来"校正"这个偏差。该公式确保了无论样本量多大,计算出的标准差都是无偏的(即长期平均下来等于真实值)。
当样本量n>25时,A3系数通过组合公式计算:A3(n) = 3 / (c4(n) × √n),A3系数专门用于X̄-S图(均值-标准差图)的控制限计算。它结合了c4系数的修正作用和样本量的影响。数字"3"代表3倍标准差的统计控制原理(99.7%的数据应该在3倍标准差范围内)。这个公式确保了控制限的计算既考虑了标准差的偏差修正,又考虑样本量对控制限宽度的影响。
单位缺陷数 = 缺陷总数/检查单位大小
中心线=加权平均单位缺陷数
控制限=平均单位缺陷数 ± 3×√(平均单位缺陷数/检查单位大小)
中心线=平均缺陷数
控制限=平均缺陷数 ± 3×√平均缺陷数
中心线=平均不合格品数
控制限=平均不合格品数 ± 3×√[平均不合格品数×(1-不合格品率)]
不合格品率 = 不合格品数/检查总数
中心线=总体不合格品率
控制限=总体不合格品率 ± 3×√[总体不合格品率×(1-总体不合格品率)/样本量]
中心线=平均值
控制限:平均值 ± 3×标准差
I图:中心线=总均值,控制限=总均值 ± 3×标准差
MR图:中心线=平均移动极差,上限=3.267×平均移动极差,下限=0
中心线=总均值(所有子组均值的平均)
控制限:总均值 ± 3×(总体标准差/√平均样本数)
X̄图:中心线=总均值,控制限=总均值 ± 3×(平均极差/平均d2系数/√平均样本数)
R图:中心线=平均极差,控制限=平均极差 ± 3×(平均d3系数/平均d2系数×平均极差)
X̄图:中心线=总均值,控制限=总均值 ± 3×(平均标准差/平均c4系数/√平均样本数)
S图:中心线=平均标准差,控制限=平均标准差 ± 3×(平均标准差/平均c4系数×√(1-平均c4系数2))
2、操作
SPSSAU中进行质量控制图时,需要选择数据类型,数据格式(子组数据还是单个测量值),以及如果是子组数据时,需要确认具体子组的表示方式(单列还是多列)。
提示:
如果是单列数据格式需要设置‘子组大小’参数,比如有100个样本点,子组大小为5,那子组个数=100/5=20,设置子组大小后SPSSAU自动计算子组个数。如果是多列数据格式,格式上为‘一行表示一个子组’。
另:SPSSAU默认提供Demo数据,取消‘Demo数据’复选框后则清空默认数据,研究者粘贴实际数据到编辑框后,点击‘开始分析’即可。
3、SPSSAU输出结果
默认情况下,SPSSAU提供控制图,以及分析建议。与此同时,SPSSAU提供控制图时,其列出四项异常值监控方式,分别是距离中心线距离多少标准差(单点超出控制限),连续多少点在中心线同一侧(连续点偏向一侧),连续多少点在递增或递减(连续上升或下降趋势),连续多少点上下交错等共4种异常值检测,并且会在控制图中自动进行切换标识。
规则一:单点超出控制限,默认以超出3σ控制限(UCL或LCL)作为标准,正常过程中,数据点落在3σ外的概率仅为0.27%,研究者可自行进行切换修改该标准。此类点超出控制限时,一般意味着过程发生重大偏移。
规则2:连续点偏向一侧,默认以连续9个点落在中心线同一侧,一般情况下连续9点在同侧的概率为(1/2)^9 ≈ 0.2%。此类情况时,一般意味着过程均值发生系统性偏移。
规则3:连续上升或下降趋势,默认以连续6个点呈单调递增或递减作为标准。一般情况下6个点严格单调的概率为2/6! ≈ 0.28%。出现此类异常时,可能意味着过程存在渐进性趋势变化(如设备磨损)。
规则4:上下交错,默认以连续14个点在中心线上下交替出现作为标准。
4、剖析
涉及以下几个关键点,分别如下:
子组数据的数据格式?
如果是单列数据格式需要设置‘子组大小’参数,比如有100个样本点,子组大小为5,那子组个数=100/5=20,设置子组大小后SPSSAU自动计算子组个数。如果是多列数据格式,格式上为‘一行表示一个子组’。
清空Demo数据?
SPSSAU中进行控制图时,默认提供Demo数据,取消‘Demo数据’复选框后则清空默认数据,研究者粘贴实际数据到编辑框后,点击‘开始分析’即可。
控制图异常值判断判断?
SPSSAU当前对控制图异常点判断上,默认提供四项异常值监控方式,分别是距离中心线距离多少标准差(单点超出控制限),连续多少点在中心线同一侧(连续点偏向一侧),连续多少点在递增或递减(连续上升或下降趋势),连续多少点上下交错。
SPC控制系数是什么意思?
计算公式中会出现,比如d2、d3、c4和A3表等,其都是统计学家通过复杂的数学推导得出的标准系数。这些系数确保了控制图的准确性。当n时,SPSSAU会自动计算,具体见本文档理论说明。
来源:三胖读书