非劣效性试验 + 连续变量的样本含量估计

B站影视 韩国电影 2025-08-09 22:43 2

摘要:非劣效性试验中对于连续变量,通常是比较试验组和对照组的均值。其样本量估算的基本原理是基于统计学的假设检验,通过计算在给定的检验效能下,能够检测出试验组与对照组之间均值差异不超过预先设定的非劣效界值的最小样本量。一般会根据正态分布的原理,利用相应的统计公式,结合

作者/风仕

上期已经讲完非劣效性试验 + 分类变量的样本含量估计,这期开始讲非劣效性试验 + 连续变量的样本含量估计

,主要从基础知识、问题与数据、对问题分析及PASS软件操作进行讲解。

基础知识

1.基本原理

非劣效性试验中对于连续变量,通常是比较试验组和对照组的均值。其样本量估算的基本原理是基于统计学的假设检验,通过计算在给定的检验效能下,能够检测出试验组与对照组之间均值差异不超过预先设定的非劣效界值的最小样本量。一般会根据正态分布的原理,利用相应的统计公式,结合预期的均值、标准差以及设定的非劣效界值等参数来进行样本量的估算。

2.设计特点

与非劣效性试验 + 分类变量类似,只是观察指标为连续变量,如血压降低值、血糖变化值等,用于比较试验组和对照组在连续变量上的差异是否在非劣效界值范围内。

3.影响样本量的因素

(1)非劣效界值:是临床上认为试验组相对于对照组在连续变量上可接受的最大差异值。该界值越小,说明对试验药的要求越严格,要证明非劣效性就需要更大的样本量。例如,在评估两种降压药对血压降低值的影响时,若将非劣效界值设定为 5mmHg,意味着试验药降低血压的效果只要不低于对照药 5mmHg,就认为试验药非劣效,而如果将界值设为 3mmHg,则需要更多的样本量来验证。

(2)预期均值差异:试验组和对照组预期的连续变量均值差异影响样本量。若两者预期均值差异较小,需要更大样本量来准确判断非劣效性;若差异较大,所需样本量相对较小。例如,试验组预期均值为 50,对照组为 55,比试验组预期均值为 40,对照组为 55 的情况,证明非劣效性需要的样本量更大。

(3)标准差:反映了连续变量的离散程度。标准差越大,说明数据的变异性越大,需要更大的样本量来稳定地估计均值和检测差异。比如,在测量患者的某项生理指标时,若该指标在人群中的标准差较大,为了准确比较试验组和对照组的差异,就需要更多的样本。

(4)检验效能:一般取 80% 或 90%,表示当真实存在非劣效差异时,能够正确拒绝无效假设(即认为试验药劣于对照药)的概率。检验效能越高,所需样本量越大。例如,将检验效能从 80% 提高到 90%,样本量通常会增加。

(5)显著性水平:通常取双侧 0.05 或单侧 0.025。显著性水平越小,对结果的准确性要求越高,会使样本量增加。单侧检验比双侧检验所需样本量少,因为单侧检验只关注试验药是否不差于对照药这一个方向的差异。

4.估算方法

5.注意事项

(1)参数估计的准确性:准确估计非劣效界值、预期均值和标准差等参数至关重要。这些参数应基于可靠的前期研究数据、临床经验或相关文献。若参数估计不准确,可能导致样本量不合理,影响试验的科学性和可靠性。例如,对标准差的估计过低,会使计算出的样本量过少,无法准确检测出组间差异。

(2)数据的正态性:连续变量样本量估算的方法通常基于数据服从正态分布的假设。在实际应用中,需要对数据的分布进行检验和评估。如果数据不服从正态分布,可能需要进行数据转换或采用非参数方法进行分析,同时样本量估算方法也可能需要相应调整。

(3)考虑个体差异和测量误差:个体之间的差异以及测量过程中的误差会影响连续变量的取值。在估算样本量时,要充分考虑这些因素,适当增加样本量以克服其带来的不确定性。例如,对于一些生理指标的测量,不同测量时间、测量仪器等都可能引入误差,需要通过增加样本量来减小误差对结果的影响。

(4)多次测量和重复测量数据:如果研究中涉及对同一对象的多次测量或重复测量数据,如在不同时间点测量患者的某项指标,需要考虑数据的相关性。在样本量估算时,要采用适当的统计方法来处理这种相关性,否则可能会低估或高估样本量需求。

(5)伦理和实际可行性:确定样本量时要兼顾伦理和实际情况。样本量过大可能使过多受试者承受试验风险,增加研究成本和实施难度;样本量过小则无法得出可靠结论。需要在保证试验科学性和伦理合理性的基础上,综合考虑研究资源、时间等因素,确定合理的样本量。

问题与数据

临床研究常见的假设检验有差异性检验、非劣效性检验、等效性检验和优效性检验。以安慰剂为对照的 RCT 被视为药物开发的金标准,这类研究的假设检验通常是差异性检验。然而,如果已经有了疗效肯定的药物 ,仍用安慰剂作对照 ,会存在伦理风险。随着有效药物的大量出现,有突破性疗效的药物越来越少 ,因此在阳性对照试验中,更多的情形是探索 新药与标准药物的疗效是否相当 ,并不一定必须超过标准药物 ,这种临床试验即非劣效性试验

(non-inferiority trail) [1]。

假设新药 A 与现有治疗药物 B 药的疗效基本相当 ,但是 A 药的给药方式更加方便、耐受性也更好 ,此 时就可以设计成非劣效性试验(即 A 药的疗效不差于 B 药)。遗憾的是,许多非劣性临床试验,仍按照安慰剂对照的差异性试验来设计,导致非劣性试验的样本量估计、统计推断方法应用不够合理。

某研究者拟开展一项非劣效设计的随机对照试验,探讨某降压新药 A 的降压效果是否不差于标准药物 B。 根据以往的文献资料 ,标准药物 B 可降低舒张压(DBP)约(13.0 ±6.0) mmHg。假设使用新药 A 的研究 对象, DBP 降低的标准差也为 6.0 mmHg ,取非劣效性界值(δ)为 2 mmHg。设α =0.025(单侧) ,把握 度(1-β) =0.8 ,两组研究对象数量相等 ,则需要多少样本量?

对问题分析

估算非劣效性试验的样本量时 ,首先应当拟定拟定检验水准α和检验效能 1-β。一般情况下非劣效性试 验的假设检验是单侧的 ,我们可选取α =0.025(单测) , 1-β可取 0.8。

此外 ,本研究的研究结局是连续变量 ,还需要根据既往文献或预试验的结果 ,给定三个参数:

(1)对照组研究结局的均数和标准差;

(2)干预组研究结局的标准差;

(3)非劣效性界值δ。

非劣效性界值δ的大小应该由临床专家来确定 ,一般是从专业角度反复论证并结合研究本身得到 ,切不 可随意决定。

有学者对δ提供了可供参考的建议标准,如血压可取 5 mmHg,胆固醇可取 0.52 mmol/L (20 mg/dl), 白细胞可取 500 个/mm3 等。当δ难以确定时,可酌情取 1/5-1/2 个标准差或对照组均数的 1/10-1/5。 对两组率而言 ,有人建议δ最大不应超过对照组样本率的 1/ 5。δ也不能过小 ,否则 ,所需的样本含量 可能会太大而不切实际 [2]。

PASS软件 操作

1. 选择 Means → Two Independent Means → Non-Inferiority → Non-Inferiority Tests for Two Means [Differences]

(或者选择 Non-Inferiority → Means → Non-Inferiority Tests for Two Means [Differences],两者 是一样的)

2.如下图填写相对应的参数后 ,点击 Run

3.结果解释

PASS 软件给出了样本量计算的结果 ,试验组和对照组各需要 143 例研究对象。

由于我们在前面选择了 High Means Are: Better ,所以软件自动把非劣效性界值( Non-Inferiority Margin, NIM)取了负数。但是在填写参数的界面中, NIM 必须是正值。同时注意到 ,研究的 H0:

Diff-NIM 表示 ,研究的原假设是试验组与对照组效应值之差≤-2。

4.撰写结论

本研究为非劣效设计的随机对照试验,拟探讨某降压新药 A 的降压效果是否不差于标准药物 B。根据以 往的文献资料 ,标准药物 B 可降低舒张压(DBP)约(13.0 ±6.0) mmHg。假设使用新药 A 的研究对象,

DBP 降低的标准差也为 6.0 mmHg,取非劣效性界值(δ)为 2 mmHg。设α =0.025(单侧),把握度(1-β) = 0.8 ,两组研究对象数量相等 ,利用 PASS 11 软件计算得到试验组和对照组的样本量 N1 =N2 =143 例。

1.单个问题答疑咨询。1对1答疑、小额付费、48小时内有效。

2.答疑咨询年度会员。一年365天时限内各种统计分析问题1对1答疑,性价比高。

3.购买视频课程赠送课程相关主题内容1对1答疑1年。

来源:孙医生工作室

相关推荐