摘要:随机对照试验(RCT)被公认为是确定因果关联的金标准。但受伦理、实践和可行性方面的影响,不适合开展RCT时,越来越多的研究者选择通过大型观察性研究获得证据。
随机对照试验(RCT)被公认为是确定因果关联的金标准。但受伦理、实践和可行性方面的影响,不适合开展RCT时,越来越多的研究者选择通过大型观察性研究获得证据。
那这时候我们就需要控制观察性研究自身设计缺陷所引起的各种偏倚,提高观察性研究数据因果推断的效能,为了达到这个目的,近年来提出了模拟目标试验(target trial emulation,TTE) 概念。
模拟目标试验即在设计观察性研究时,通过假想一个解决研究问题的目标临床试验,参照目标临床试验进行观察性研究的关键因素设计,在因果推断方法学的合理运用下也可以达到RCT试验的效果。
之前我们对发表在《European Stroke Journal》杂志的一篇Review article进行了分享。这篇评论文章为卒中研究人员对基于观察性数据的描述性流行病学和因果推断研究,提供了十个需要考量和实施的重要要点,以确保的有效性和可解释性。
今天我们分享第五点和第六点,描述性流行病学与因果推断研究中的偏倚概述以及使用模拟目标试验方法定义因果效应。
但由于篇幅太长,只能陆续分享整篇文章。
要点回顾
第一点:就是要考虑您将使用的数据类型是专门为研究而收集的数据,还是为行政和临床目的(但非特定研究目标)常规收集的健康数据。
第二点:是要考虑您的研究问题类型是因果关系还是描述性流行病学?
第三点:基于观察性数据的因果推断
第四点:各种因果效应类型
10点入门:如何规范使用观察性数据进行描述性流行病学和因果推断研究
如何利用观察性健康数据,成功回答因果推断问题?
第五点:描述性流行病学与因果推断研究中的偏倚概述
研究中的偏倚,通常被定义为系统性误差,这些误差在研究过程的各个环节中产生,导致结果或结论偏向某一特定方向。这类系统性误差可能发生在抽样、测量、检验或推理阶段。无论是描述性流行病学/关联研究,还是基于观察数据的因果推断研究,都可能受到多种偏倚的影响。
当然,任何旨在从样本推及总体的实证研究,都不可避免地存在随机误差,这种误差会影响关键估计量(如发生率、比例或关联度量)的精确度。虽然随机误差确实会威胁研究的效度,但由于它不具备系统性,而且影响的是估计值的精确度而非准确度,因此一般不被归为“偏倚”。
与描述性流行病学和因果推理研究相关的偏倚
1.抽样偏倚
描述性流行病学研究的目的是刻画定义明确人群中健康状况、疾病及有害或有益暴露的分布情况,关注真实观测到的现象。抽样偏倚是此类研究的核心关注点。
研究者通常在目标(或称源)人群层面提出研究问题,例如,估计 60 岁以上高血压患者的缺血性卒中发病率。该目标人群可以是某一地区、国家或州,也可以是某社区或特定地点。为保证样本所获得的风险估计具有代表性,研究者必须从已界定的人群中进行恰当抽样,并采用有效的抽样策略。
根据 RECORD 指南(见要点 1),要实现样本数据对研究问题的有效推论,须确保目标人群定义明确且抽样策略合理。
2.测量误差与非随机缺失数据偏倚
测量偏倚源于对暴露、结局或协变量评估中的误差,这些误差可能是相互独立的,也可能依赖于暴露或结局(即差异性误差)。例如,在一项关于酒精消费与卒中关系的病例-对照研究中,存在因卒中发生与否而导致回忆酒精摄入量时出现偏倚(回忆偏倚)。
因此,报告的酒精摄入量与卒中之间的关联,可能与酒精摄入的真实因果效应不同,同时也会对描述性/关联研究中的结论造成偏倚。
总之,对描述性流行病学/关联研究问题的有效回答需要适当的抽样、对结局和任何协变量的有效测量以及适当的数据分析。加强流行病学观察性研究的报告(STROBE 指南)详细对这三方面可能出现的偏倚与威胁研究效度的因素提供了详尽说明。
与因果推理研究特别相关的偏倚
1.混杂偏倚
指示性混杂(confounding by indication)发生于某种疾病或患者特征既影响接受特定治疗(暴露)的概率,又影响研究结局。
例如,如果未控制吸烟这一共同原因,就可能错误地将“携带打火机”(暴露)与“卒中风险增加”(结局)建立因果联系。
又如,卒中再灌注治疗方式(单纯介入治疗 vs 联合溶栓)与 90 天功能结局的关联,可能因治疗时延(卒中发作到治疗的时间)这一既影响选用何种治疗,又影响结局的共同因素而产生混杂。
本指南第 7 点将详述如何利用有向无环图(DAG)识别与控制此类混杂。
2.选择偏倚
当既是暴露又是结局的共同效应因子被人为控制(如分层、限制、回归调整或匹配)时,就会产生选择偏倚,并可能导致虚假的关联。
例如,假设带有某生物标志物的卒中幸存者与康复理疗次数无关,且二者均与良好康复结局相关。如果只纳入康复良好的患者进行分析,就会在生物标志物状态与理疗次数之间人为地建立关联:
一方面,若这类患者都未接受额外理疗,则推断其必定生物标志物阳性;
另一方面,若都是标志物阴性,则推断其必定接受了更多理疗。
由此,即使生物标志物与理疗本无关联,当对“良好康复”进行条件限制时,二者也会显现出虚假的关联。此外,非随机缺失数据、幸存者偏倚、参与者偏倚、自选择偏倚等,也都属于选择偏倚的具体形式。
Hernán 等人提出,通过对“随访起点”、资格定义与治疗分配三者的对齐(即目标试验模拟),可防范此类偏倚,并在观察性研究中采用相应分析方法加以解决(见要点 6)。量化偏倚分析(Quantitative Bias Analysis)可评估研究设计或统计分析未能消除的残余偏倚对结果的潜在影响,感兴趣的读者可参阅相关综述文献。
建议 5.1:卒中研究者应注意:描述性流行病学/关联研究中出现的某些偏倚类型,与因果推断研究中出现的偏倚不同,或表现不同。
建议 5.2:尽管混杂偏倚与描述性/关联研究无关,但选择偏倚、测量偏倚等其它偏倚仍应在研究设计与分析中积极识别并加以缓解。
第六点:使用目标模拟试验方法定义因果效应
相比于第 3 点中讨论的 Rubin 反事实框架(该框架为理解因果推断提供了宏观结构),Hernán 等人最近提出的“目标试验”(Target Trial)方法,则在 Rubin 框架内提供了更为具体的方法学指导。
目标模拟试验方法要求研究者详尽描述一个假设的随机化临床试验方案——即如果在伦理、实践和可行性方面允许的话,研究者本希望以实验干预的形式操纵感兴趣的暴露。
举例而言,若我们欲研究酒精摄入(暴露)对卒中风险(结局)的因果效应,出于对酒精危害的既有认知,将受试者随机分配到不同酒精摄入量组(包括潜在不安全剂量)的真实临床试验是不合伦理的。通过目标试验方法“构建”这样一个假设的随机临床试验,有助于研究者明确阐述他们欲估计的因果效应所依赖的核心假设。
举例
在卒中研究领域,“PRECISE”研究是目标试验方法的一个最新应用范例
——该研究旨在评估一项政府激励政策对卒中患者在初级保健中采用慢性病管理计划的影响,利用了注册登记数据与政府行政数据的链接。
参考文献:Andrew NE, Ung D, Olaiya MT, et al. The population effect of a national policy to incentivize chronic disease management in primary care in stroke: a population-based cohort study using an emulated target trial approach. The Lancet Regional Health – Western Pacific 2023; 34: 100723.
按照 Hernán 提出的框架,作者明确描述了研究设计的七个关键组成要素(见表 1),使得研究者能够在真实世界中考察该已实施策略的总体效应(ATE)。
研究队列仅限于符合该政策适用条件的个人,即社区居住且预期在暴露期间存活者;
模拟临床试验原则的另一个做法是,仅纳入在暴露期内曾就诊初级保健医生、即有可能获得该政策干预者。
为缓解幸存者偏倚,仅分析在暴露期后依然存活的个体。
研究中,对慢性病管理计划的健康保险理赔数据用于评估政策的群体水平有效性(而非直接评估其支持的临床干预),从而可靠地识别了暴露;
同样地,死亡结局通过国家死亡登记处以盲法确认,确保了结果识别的可靠性。
如 Franklin 等人所强调,精确界定比较组与研究终点,对于使观察性模拟结果与随机对照试验(RCT)结果一致至关重要。
即便在那些无法明确定义与研究暴露相对应的假想干预的情形下,采用目标试验模拟方法仍可最大限度地减少多种偏倚的潜在影响。
此外,该方法有助于识别传统观察性研究框架下难以控制、甚至可能被忽视的偏倚。特别是,Hernán 等人提出了一个基于目标试验的框架,用以描述和预防此类偏倚,并建议了相应的分析方法。
对观察性数据的分析必须进行充分而恰当的稳健性检验,以评估这些偏倚对目标效应的潜在影响。此类稳健性检验策略可能包括:在不同情景下执行多次目标试验、考察不同亚组间平均处理效应(ATE)或平均处理效应于处理组(ATT)的差异,或开展系统性的偏倚分析。这些内容将在第 7、9、10 点中作更详细讨论。
建议 6.1:在基于观察性数据的因果推断研究设计与实施中,应采用目标试验模拟方法,因为它有助于规避观察性研究常见的方法学陷阱,并通过识别和最小化多种偏倚来提高研究效度。
参考文献:
Churilov L, Hayward K, Yogendrakumar V, Andrew N. Conducting descriptive epidemiology and causal inference studies using observational data: A 10-point primer for stroke researchers. European Stroke Journal. 2025;0(0). doi:10.1177/23969873251332118
来源:郑老师讲统计