摘要:在上一期,我们已经讲完了卡方检验的基础知识,这期开始讲一般四格表卡方检验,我们主要从一般四格表卡方检验介绍、一般四格表卡方检验使用条件及案例的SPSS操作演示这几方面进行讲解。
作者/风仕
在上一期,我们已经讲完了卡方检验的基础知识,这期开始讲一般四格表卡方检验,我们主要从一般四格表卡方检验介绍、一般四格表卡方检验使用条件及案例的SPSS操作演示这几方面进行讲解。
一般四格表卡方检验介绍
一般四格表/检验可以检验两个样本的总体分布是否相同,或者两个样本是否来自同一总体。连续校正卡方只在四格表中才计算。
如何选择统计结果,教科书给出了如下判断标准:
1.当n≥40且所有T≥5时(T代表每个样本的理论频数),用Pearson卡方,若所得P=0. 05时,用Fisher精确检验。
2.当n≥40但有1≤T≤5时,用连续校正卡方。
3.当n
研究表明,在Pearson卡方、似然比卡方和Fisher的精确检验三种方法中,似然比卡方最为准确,即使在小样本中也是如此。而Fisher的确切概率法的分布假设在很多时候并不成立,因此建议大家多参考似然比卡方的结果。
对于Fisher 确切概率法有关说法:(1)凡是四格表资料均可采用 Fisher 确切概率法进行假设检验。(2)Fisher 确切概率法基于超几何分布,计算的基本步骤是在四格表的周边合计不变的条件下,计算表内四个基本数据的各种组合之概率,再计算满足一定条件的各四格表累计概率;若行双侧检验,则计算满足等于及大于样本|p1-p2|条件的所有格子的累计概率;若进行单侧检验,只计算等于及大于样本(p1-P2)的累计概率。(3)依次增减四格表中某个格子(一般选用行合计与列合计均为最小的那个格子)的数据,可列出周边合计不变条件下各种组合的四格表(一般可列出最小周边合计数加1 个四格表)
一般四格表卡方检验使用条件
1.样本量要求:
四格表卡方检验要求每个格子的理论频数(即期望频数)应至少为5。如果某个格子的理论频数小于5,可以考虑合并相邻的格子或使用Fisher精确检验(适用于样本量较小的情况)。
2.总样本量要求:
总样本量必须至少为40。这是卡方检验能够有效进行的统计假设之一。
3.格子的理论频数分布:
如果所有格子的理论频数都大于或等于5,使用Pearson卡方检验;如果理论频数在1到5之间,使用连续性校正的卡方检验;如果任何格子的理论频数小于1或总样本量小于40,使用Fisher精确概率法。
这些条件确保了卡方检验的统计效能和结果的可靠性。在实际应用中,如果数据不满足这些条件,可能需要调整分析方法或考虑使用其他更适合的检验方法。
案例的SPSS操作演示
分析示例
将病情相似的169名消化道溃疡患者随机分成两组,分别用洛赛克与雷尼替丁两种药物 治疗,4周后疗效见下表。问两种药物治疗消化道溃疡的愈合率有无差别?
研究假设
H0:两药治疗消化道溃疡的愈合率相同,π₁=π₂。
H₁:两药治疗消化道溃疡的愈合率不同,π₁ ≠π2。
α=0.05
数据录入
1. 变量视图
名称 treat 标签 处理 值1=洛赛克2=雷尼替丁
名称 result 标签 疗效 值1=愈合2=未愈合
名称 weight 标签 权重
2.数据视图 注意该数据视图和四格表的差别。
操作流程
1.下图是对数据的预定义,在数据(D) 下拉菜单框中完成,即设置权重变量,该操作是四格表运算的基本操作。
2.下图是四格表统计的主对话框,主要设置行变量和列变量,该例中行变量指分组变量 处理treat, 列变量指结果变量疗效result, 行变量和列变量的设置只对结果的排列产生影响,并 不影响其统计结果,因此大家将行变量与列变量调换也可。
3.下图是对检验方法的选择,选用卡方检验(Chi-square), 该检验用于判断行、列变量是 否独立,如果数据不满足卡方检验的要求(不能有单元格的期望值
4. 下图中各选项是计算四格表中统计描述指标,观察值(observed) 指原始数据,期望值 (expected) 指统计过程中的理论数,一般用处不大。各种百分比,如行百分比(Row) 、列百分 比(Column)及合计百分比(Total), 均为四格表的统计描述内容,比较重要。
结果解释
1.下表是处理记录缺失值情况报告,可见169例均为有效值。
2.下表标明了各百分比结果,百分数的含义关键是确定分子和分母,分子好确定,也就是
各单元格的观察值(计数),分母则需要确定所对应的100%项,如洛赛克组中有三个百分数
值,处理中的%值为75.3%,对应的100%为处理横向合计,即在洛赛克处理组中,治愈率为75.3%;疗效中%值为55.7%,对应的100%为纵向疗效值,即在所有愈合的病例中,由洛赛克治疗而愈合的占55.7%;总计37.9%,对应的100%为右下角的总合计值,即洛赛克治疗愈合的病例占总病例的37.9%。在本例中,最重要的百分数为处理中%,当然,根据需要,大家可以挑选不同的%作为统计描述值。
3.下表给出了一堆检验结果,如何选择统计结果,教科书给出了如下判断标准:
(1)当n≥4且所有T≥5时,用Pearson 卡方,若所得P≈0.05时,用Fisher 精确检验。
(2)当n≥40但有1≤T≤5 时,用连续校正卡方。
(3)当n
本例N=169≥40, 且表下a 注释中说明0单元格的期望计数(理论数,T)
注意事项
1. 连续校正卡方只在四格表中才计算。
2.研究表明,在Pearson 卡方、似然比卡方和Fisher 的精确检验三种方法中,似然比卡方 最为准确,即使在小样本中也是如此。而 Fisher 的确切概率法的分布假设在很多时候并不成立,因此建议大家多参考似然比卡方的结果。
参考:《临床医学研究中的统计分析和图形表达实例详解》
1.单个问题答疑咨询。1对1答疑、小额付费、48小时内有效。
2.答疑咨询年度会员。一年365天时限内各种统计分析问题1对1答疑,性价比高。
3.购买视频课程赠送课程相关主题内容1对1答疑1年。
来源:孙医生工作室