摘要:在上一期,我们已经讲完了双向无序的列联表分析基础知识,这期开始讲双向无序的列联表分析,我们主要从双向无序的列联表分析介绍及案例的SPSS操作演示这几方面进行讲解。
作者/风仕
在上一期,我们已经讲完了双向无序的列联表分析基础知识,这期开始讲双向无序的列联表分析,我们主要从双向无序的列联表分析介绍及案例的SPSS操作演示这几方面进行讲解。
双向无序的列联表分析介绍
双向无序列联表是指行变量和列变量均为无序分类变量,统计方法和一般四格表卡方检验一致。是针对行变量和列变量是大于2个分组的无序分类变量进行相关性分析的方法。
RC列联表主要涉及到两类变量:行变量,列变量。其次还要明白这些行变量与列变量的属性,当计量资料的行变量与列变量均为无序变量时,我们称之为双向无序的RC列联表,可采用卡方检验进行分析。
这里提到了分类变量的属性,如何判断变量的属性呢?我们生活中接触到的分类变量主要有两类,有序变量和无序变量。举个例子,有序分类变量,药物治疗的效果:无效,有效,显效,痊愈;年龄的分类:40岁;成绩的分类:优秀,良好,合格,不合格。无序分类变量,比如性别:男,女;国籍:中国,俄罗斯,美国。
案例的SPSS操作演示
分析示例
某省随机抽查了1043 位居民的ABO血型和MN 血型,资料如下表所示。问两种血型的 构成比有无差别(或两种血型有无关联性)?
研究假设
H0:两种血型系统分布无差别。
H1:两种血型系统分布有差别。
α=0.05
数据录入
1. 变量视图
名称 x1 标签 ABO血型
名称 x2 标签 MN血型
名称 weight 标签 权重
2.数据视图
注意该数据视图和R×C 表的差别
操作流程
1. 下图是对数据的预定义,在数据(D) 下拉菜单框中完成,即设置权重变量,该操作是对 R×C表运算的基本操作。
2. 下图是R×C 表的基本对话框,主要设置行变量和列变量,一般行变量指分组变量,列变量指结果变量,该例中行变量与列变量可以随便制订,行变量和列变量的设置只对结果的排列产生影响,并不影响其统计结果,因此大家可以任意指定行变量和列变量。
3. 下图是对话框选用统计量,本次选用卡方检验(Chi-square), 该检验用于判断行、列变量是否独立,如果数据不满足卡方检验的要求(不能有单元格的期望值
4 .下图中各项是列联表单元格中的描述性指标,观察值(observed) 指原始数据,期望值 (expected) 指统计过程中的理论数, 一般用处不大。各种百分比,如行百分比(Row)、列百分比(Column)及合计百分比(Total)这是R×C 表中重要的统计描述内容。
结果解释
1.下表是处理记录缺失值情况报告,可见1043例均为有效值。
2.下表标明了各百分比结果,百分数的含义关键是确定分子和分母,分子好确定,也就是各单元格的观察值(计数),分母则需要确定所对应的100%项,主要有三类100%,各横向总计100%,各纵向合计100%,总数共计100%。大家根据需要进行选取,本例当中各百分比并不重要,不需要用百分比作统计描述。
3.R×C 表卡方检验一般看首行 Pearson卡方值,但是若1/5以上的格子理论频数
说明两种血型系统分布不同。
注意事项
1. 卡方检验的两两比较:当总体出现差别时,可以进行消耗函数的校正(即对a 系数进行 校正),然后进行多组之间的两两比较。
2.卡方的精确分割:当R×C 表资料中含有较多小格频数时,最后结合专业知识对资料进 行合并,即对原先分组过细的列联表的列或行进行合并,使调整后的列联表能更好地揭示两个 变量之间的关系,合并的原则是:应当将相邻的无显著性差别的列或行进行合并,且这种合并 在专业上有实际意义;各分表的自由度之和应等于总表的自由度,各分表的卡方值之和应当等 于总表的卡方值。
参考:《临床医学研究中的统计分析和图形表达实例详解》
1.单个问题答疑咨询。1对1答疑、小额付费、48小时内有效。
2.答疑咨询年度会员。一年365天时限内各种统计分析问题1对1答疑,性价比高。
3.购买视频课程赠送课程相关主题内容1对1答疑1年。
来源:孙医生工作室