摘要:上期已经讲完ROC 曲线下面积的样本含量估计,这期开始讲非劣效性试验 + 分类变量的样本含量估计,主要从基础知识、问题与数据、对问题分析及PASS软件操作进行讲解。
作者/风仕
上期已经讲完ROC 曲线下面积的样本含量估计,这期开始讲非劣效性试验 + 分类变量的样本含量估计,主要从基础知识、问题与数据、对问题分析及PASS软件操作进行讲解。
基础知识
1.基本原理
非劣效性试验的目的是验证试验药的疗效是否不差于对照药。对于分类变量,通常采用率来进行比较,如有效率、治愈率等。样本量估算的基本原理是基于统计学假设检验,通过确定合适的样本量,使得在给定的检验效能下,能够以较高的概率检测出试验药与对照药之间的非劣效性差异。
一般来说,是根据预先设定的非劣效界值、预期的试验药和对照药的有效率以及期望的检验效能等参数,利用相应的统计学公式来计算所需的样本量。
2.设计特点
旨在验证新的干预措施(试验组)在疗效上不劣于已有的标准干预措施(对照组),观察的指标为分类变量,如治愈率、有效率等。
3.影响样本量的因素
(1)非劣效界值:这是一个关键的参数,它表示临床上可以接受的试验药相对于对照药的最大允许劣效程度。非劣效界值越小,意味着对试验药的疗效要求越高,需要更大的样本量来验证其非劣效性。例如,若将非劣效界值设定为 5%,则表示试验药的有效率只要不低于对照药有效率的 5%,就认为试验药非劣效。
(2)预期有效率:试验药和对照药的预期有效率对样本量有重要影响。如果两者的预期有效率较为接近,且都处于较高水平,那么需要较大的样本量才能准确判断非劣效性;反之,如果两者预期有效率差异较大,所需样本量相对较小。例如,试验药预期有效率为 80%,对照药为 85%,要证明非劣效性就比试验药 60%、对照药 85% 的情况需要更多样本量。
(3)检验效能:又称把握度,一般取 80% 或 90%,表示在真实存在非劣效差异的情况下,能够正确拒绝无效假设(即认为试验药劣于对照药)的概率。检验效能越高,所需样本量越大。例如,从 80% 提高到 90% 的检验效能,样本量会相应增加。
(4)显著性水平:通常取双侧 0.05 或单侧 0.025。显著性水平越小,对结果的准确性要求越高,会导致样本量增加。单侧检验比双侧检验所需样本量少,因为单侧检验只考虑一个方向的差异(即只关注试验药是否不差于对照药),而双侧检验还需考虑试验药优于对照药的情况。
4.估算方法
5.注意事项
(1)参数估计的准确性:在估算样本量之前,需要对非劣效界值、预期有效率等参数进行合理估计。这些估计值应该基于以往的研究数据、临床经验或相关文献。如果参数估计不准确,可能导致样本量过大或过小,影响试验的效率和结果的可靠性。
(2)考虑脱落和失访:在实际试验中,不可避免地会有患者脱落或失访。因此,在计算样本量时,需要适当增加一定比例的样本量以弥补这部分损失。一般根据以往类似试验的经验,预估脱落率在 10% - 20% 左右,并据此调整样本量。
(3)多中心试验的影响:如果是非劣效性试验是多中心试验,不同中心之间可能存在患者特征、医疗水平等方面的差异,这可能会增加试验的变异性。因此,在样本量估算时,需要考虑中心效应,适当增加样本量以保证结果的稳定性和可靠性。
(4)伦理和实际可行性:虽然样本量越大,试验结果越准确,但也要考虑伦理和实际可行性。过大的样本量可能导致过多的患者暴露于试验药物,增加伦理风险,同时也会增加研究的成本和难度。因此,在保证试验科学性的前提下,要权衡伦理和实际因素,确定合理的样本量。
问题与数据
某研究者拟开展一项非劣效设计的随机对照试验,探讨某降压新药 A 的降压效果是否不差于标准药物 B。 根据以往的文献资料 ,使用标准药物 B 后 ,高血压病患者的全因死亡率为 10%。
新药的用药依从性更好,假设新药 A 对全因死亡的效果不劣于标准药物 B。取非劣效性界值(δ)为2%(即 使用新药 A 后 ,患者的全因死亡率不大于 12%) ,设α =0.025(单侧) ,把握度(1-β) =0.8 ,两组研究对 象数量相等 ,则需要多少样本量?
对问题分析
估算非劣效性试验的样本量时 ,首先应当拟定检验水准α和检验效能 1-β。一般情况下非劣效性试验的 假设检验是单侧的 ,我们可选取α =0.025(单测) , 1-β可取 0.8。
此外 ,本研究的研究结局是分类变量 ,还需要根据既往文献或预试验的结果 ,给定两个参数: 1) 对照 组研究结局的率;2) 非劣效性界值δ。
非劣效性界值δ的大小应该由临床专家来确定 ,一般是从专业角度反复论证并结合研究本身得到 ,切不 可随意决定。
有学者对δ提供了可供参考的建议标准 ,如血压可取 5mmHg ,胆固醇可取 0.52mmol/L(20mg/dl) , 白细胞可取 500 个/mm3 等。当δ难以确定时,可酌情取 1/5-1/2 个标准差或对照组均数的 1/10-1/5。
对两组率而言,有人建议δ最大不应超过对照组样本率的1/5。δ也不能过小,否则,所需的样本含量可 能会太大而不切实际。
PASS软件操作
1.选择 Proportions → Two Independent Proportions → Non-Inferiority → Non-Inferiority Tests for Two Proportions [Differences]
(或者选择 Non-Inferiority → Proportions → Non-Inferiority Tests for Two Proportions [Differences] ,两者是一样的)
2.如下图填写相对应的参数后 ,点击 Run
特别要注意的是“ High Proportion are”和“ D0( Non-Inferiority Differences)”选项:
(1)“ High Proportion are”必须正确填写。如果关注的率是越高越不好(比如本研究的全因死亡率), 则选择 Worse;关注的率是越高越好(比如痊愈率等) ,则选择 Better。
(2) 如果下方的“ High Proportion are”选择 Worse ,则需要填入正的非劣效性界值δ(如 0.02)
(3)如果下方的“ High Proportion are”选择 Better ,则需要填入负的非劣效性界值δ(如-0.02)。
3.结果解释
PASS 软件给出了样本量计算的结果 ,试验组和对照组各需要 3532 例研究对象。
4.撰写结论
本研究为非劣效设计的随机对照试验,拟探讨某降压新药 A 的降压效果是否不差于标准药物 B。根据以 往的文献资料 ,使用标准药物 B 后 ,高血压病患者的全因死亡率为 10%。
新药的用药依从性更好 ,假设新药 A 对全因死亡的效果不劣于标准药物 B。取非劣效性界值(δ)为2%, 设α =0.025(单侧) ,把握度(1-β) =0.8 ,两组样本量相等 ,利用 PASS 11 软件计算得到试验组和对照组 的样本量 N1 =N2 =3532 例。
1.单个问题答疑咨询。1对1答疑、小额付费、48小时内有效。
2.答疑咨询年度会员。一年365天时限内各种统计分析问题1对1答疑,性价比高。
3.购买视频课程赠送课程相关主题内容1对1答疑1年。
来源:孙医生工作室