摘要:在上一期,我们已经讲完了单向有序的列联表分析,这期开始讲双向有序且属性不同的列联表分析,我们主要从双向有序且属性不同的的列联表分析介绍及案例的SPSS操作演示这几方面进行讲解。
作者/风仕
在上一期,我们已经讲完了单向有序的列联表分析,这期开始讲双向有序且属性不同的列联表分析,我们主要从双向有序且属性不同的的列联表分析介绍及案例的SPSS操作演示这几方面进行讲解。
双向有序且属性不同的列联表分析介绍
当列联表列变量为有序变量(等级变量),且行变量也为属性不同的有序变量时,我们对 这种资料有两种处理方法,第一种是将行变量视为无序变量,则资料转化为单向有序列联表, 我们可以釆用多组独立样本秩和检验进行分析;第二种我们可以将行变量视为有序变量,来考 察这行变量和列变量之间的关系,釆用Spearman等级相关分析。若研究目的是分析两个有序分类变量间是否存在线性变化趋势,用有序分组资料的线性趋势X²检验。
案例的SPSS操作演示
分析示例
现有一份170例某病患者的治疗效果资料,按年龄和疗效两种属性交叉分类, 结果见下表。
数据录入
1. 变量视图
名称 age 标签 患者年龄
名称 result 标签 疗效
名称 weight 标签 权重
2.数据视图
数据预处理
这是对数据的预定义,在数据(D) 下拉菜单框中完成,即设置权重变量,该操作是R×C
表运算的基本操作。
研究方向1:关心组间差别(秩和检验)
研究假设
H0:3个年龄组疗效的总体分布位置相同。
H1:3个年龄组疗效的总体分布位置不全相同。
α=0.05
操作流程
1.下图指出了非参数检验对于数据的要求:非参数检验不假定您的数据呈正态分布。至于目的,默认为自动比较不同组间的分布,我们先不用管它,因为还需要在其他地方进行设置。
2. 下图为字段选项卡,检验字段(测量指标)框选入疗效 result,而组(分组变量)框则选入患者年龄age。值得注意的是,有时检验字段的类型必须为数值,组变量的类型必须为字符,变量类型可以在变量视图窗口进行修改。
3. 我们的研究问题为3个年龄组之间疗效是否存在差异,因此将3个年龄组之间视为无序,该资料转变成单向有序的列联表分析,所采用的方法为多组独立样本的秩和检验,所以检 验方法选用Kruskal-Wallis单因素ANOVA。可见同一数据可以根据分析目的的不同可采用不 同的方法,从而得出不同的结论。我们不应选择中位数检验,它虽然直接检验多个样本所代表 的各总体的中位数是否相同,但是检验效能很低,很难发现组间的差别。
结果解释
1.下表对检验结果作了简单介绍,原假设为各年龄组的疗效的分布相同,检验方法为 Kruskal-Wallis 检验,即多组独立样本的秩和检验,检验结果为P
2.在结果窗口双击假设检验摘要表格,弹出详细结果窗口,其结果如下:
这是常见的箱式图(box plot),常用于描述不符合正态分布的连续变量的分布特征,此处 用于表示多组等级资料,但该图大家需要特别注意,纵轴所代表的疗效并非原始数据,而是排 序后形成的疗效秩次的总体,图形能帮助大家直观地感受各组之间的数据分布。
3.下表给出了具体的统计值,调整后检验统计量为17.605,相当于教科书中的H 值 ,P
研究方向2:关心两变量之间是否相关(秩相关)
研究假设
研究问题:疗效和年龄之间是否相关
操作流程
下图对话框中选择相关性检验方法,这里有相关系数的三个选项,主要体现在对两个变量的要求不同。
(1)Pearson: 又称线性相关系数(linear correlation coefficient),是定量表述两个连续变量间 线性关系密切程度和相关方向的统计指标。
(2)Kendall 的 tau-b(K) 和 Spearman:Spearman相关系数(秩相关系数)和Kendall's等级相 关系数均对数据进行排序,但区别在于秩相关是以复合样本整体进行排序,而Kendall's等级相关则以每个样本单独进行排序,考察其方向的一致性。Spearman等级相关系数比较常用。
结果解释
在下面的结果中,可见Spearman相关系数为-0.255,该数值给出了两个信息,相关性的大小为0.255,相关系数绝对值大小为0到1之间,值越大,相关性越强,可见年龄与治疗效果 的相关性并不很大;给出了相关的方向,由于-0.255
参考:《临床医学研究中的统计分析和图形表达实例详解》
1.单个问题答疑咨询。1对1答疑、小额付费、48小时内有效。
2.答疑咨询年度会员。一年365天时限内各种统计分析问题1对1答疑,性价比高。
3.购买视频课程赠送课程相关主题内容1对1答疑1年。
来源:孙医生工作室