摘要:2022年3月,《American Journal of Epidemiology》发表了一篇题为:“Can Cross-Sectional Studies Contribute to Causal Inference? It Depends”的研究论文。
横断面研究,通常定义为在同一时间点评估暴露和结局的研究,常被认为对因果推断几乎没有参考价值。
2022年3月,《American Journal of Epidemiology》发表了一篇题为:“Can Cross-Sectional Studies Contribute to Causal Inference? It Depends”的研究论文。
研究指出,尽管横断面研究可能面临因果倒置风险、仅能评估疾病的患病率而非发病率,或仅能提供当前而非过去的暴露情况估计等局限,但并非所有横断面研究都存在这些问题。此外,这些关注点既非横断面研究独有,也非其固有属性。
仅仅将一项研究贴上“横断面”标签,并假设其中至少一种局限必然存在且至关重要,既忽视了对研究设计进行更细致评估的必要性,也可能导致放弃那些在因果关系评估中颇具价值的证据。
无论暴露与疾病在时间上的先后顺序如何,横断面研究都可能对暴露对疾病发病率的因果影响提供洞见。
使用简略术语来描述流行病学研究设计虽方便,但存在可预见的风险。其主要好处之一是利用共同的背景知识,为复杂观点的简明交流提供工具。例如,将一项研究标注为“嵌套病例–对照研究”或“病例–交叉研究”,可简明地传达参与者如何被选入研究或信息如何被获取的关键特征。
同样,“横断面研究”一词常被用来指示疾病信息和暴露信息是在同一时间点获得的。这一术语经常带有贬义,用以表示某项研究无法为因果推断提供有用信息。
例如,美国国家毒理项目健康评估与转化办公室的手册将横断面研究评分为低信心等级,世界卫生组织关于水质与传染病的出版物则简单指出“横断面研究只能提供暴露与疾病之间关联的信息,而无法建立暴露与疾病之间的时间先后关系”。
尽管大多数横断面研究固有地无法重建可用人群所来源的队列,但此类研究的结果仍能为因果推断作出贡献。
仅因设计类型即否定此类研究的发现,便忽视了对各个研究方法细节与实质问题进行更细致评估的必要性,而这种评估对于任何研究设计都是必需的。断言此类研究并非用于病因学评估,实属不实。无论数据资源开发者的最初意图如何,生成经混杂因素调整的关联度量几乎总是表明对因果效应的兴趣,这在基于调查数据的横断面研究或纵向研究的基线入组数据中亦常见。
主流流行病学教材对横断面研究的定义各异
Szklo 与 Nieto将横断面研究等同于患病率研究,而非发病率研究,并指出此类研究可能易受因果倒置影响。即便在一本顶级方法学著作中,也对横断面研究表达了多种观点:
它被讨论为估计疾病患病率的一种基础研究类型(第88页)、一种人群抽样方法(第497页),以及一种“无法区分发病率与自然病程以用于因果推断”的描述性工具(第569页)。
在 Pearce对流行病学研究设计分类的简明方法中,虽未直接提及“横断面”一词,但他指出唯有两个结构特征需加以考虑:
研究是考察疾病发病率还是患病率,以及是否存在基于结局的抽样。
当抽样时既未知暴露状态也未知疾病状态,自然无法基于任一属性进行选择。需逐一检视由“横断面研究”一词所涵盖的具体研究特征,以评估偏倚易感性。
无论研究设计如何,研究疾病患病率而非发病率、在不恰当时间段评估暴露,以及潜在的因果倒置,均可能构成重要局限;但假定这些局限必然存在于横断面研究,即可免却更深入的审查,进而可能低估了有价值的研究成果。
同时评估暴露与疾病的含义在于,我们仅掌握了瞬时的疾病状况快照(即疾病点患病率估计)及同期的暴露状况。然而,在某一时间点收集的数据有时可用于推估暴露历史,从而针对病因学相关的时间窗进行分析。
同理,亦可能获得识别疾病发病时点所需的信息:
如果我们据此正确排序评价暴露历史与疾病发生,并能考虑随时间的失访情况,这仍算是横断面研究吗?
如果因果倒置根本无法发生——例如,暴露是生殖系基因特征——又如何?
仅凭“同时评估暴露与疾病”这一标签,难以评估结果受偏倚影响的程度。所有研究设计都需考虑疾病病因学的时间进程,而“横断面”标签并不自动意味此过程被不当处理。
横断面研究的主要方法学关注点
同时测量暴露与疾病可能带来一系列偏倚。虽然这些问题并非此类数据收集方式所独有,也并非总是会出现,但同时测量暴露与疾病确实引发以下特定关注:
1.同期暴露可能与病因学无关
在假设的病因过程中,特定暴露对疾病作用的影响存在时间窗,有些时间段暴露具有影响力,而另一些时间段则无关紧要。任何研究的关键在于评估在病因学相关的时间段内的暴露。
例如,对许多慢性病而言,病因学相关的时间窗往往是漫长的,可能持续数年甚至数十年。如果我们仅在数据收集时点测量易变的暴露(此时病因学相关期已结束,即疾病已出现或未出现),所测即为无关暴露,而未能测到过去可能具有重大影响的暴露——这是一种暴露错分类。
在某些情形下,这一点显而易见:
研究吸烟与支气管炎时,我们都知道诊断当天、当周或当月的吸烟状况对支气管炎的发病并无病因学相关性。
相反,若要判断“边走路边发短信”是否增加被机动车撞击的风险,则最理想的评估时机是事故发生(或未发生)之前的瞬间,此时不需关注过去较长时间段内的行为。
即便在同一时点确认暴露与疾病状态,也常可通过回顾性问询、档案记录或反映既往暴露的生物标志物(如用乳牙检测铅暴露)来确定具有病因学意义的历史暴露。
因此,不应仅因暴露测定时机与疾病存在的相对关系,就自动降低研究等级,而应仔细判断所测暴露指标是否真实反映了病因学相关的过去时期。
2.疾病患病率可能无法代理发病率
将疾病患病率用作发病率代理所带来的不确定性由来已久,因患病率反映了发病率、疾病持续时间和生存率的综合。
例如,以现患病人为抽样基础的研究易受到“持续时间偏倚”影响——因疾病持续时间较长(由于延长存活或未痊愈),此类患者更易被纳入现患人群研究中。
如果暴露与平均疾病持续时间有关,则暴露与患病率的关联将无法准确反映暴露与发病率的关联。
然而,暴露不一定与疾病持续时间相关;即便相关,当在疾病已出现时抽样,研究者仍可获取疾病发生时点和持续时间的准确历史信息,以估算历史发病率。
在其他情况下,疾病持续时间可能非常短,使点患病率能够近似代表某一人群的即时风险(例如小儿耳部感染)。一次性评估的暴露和疾病反映了该时刻的点患病率,关键问题在于,是否能利用这些暴露与现患信息,得出关于暴露对发病率因果影响的有意义推论。
3.暴露-疾病关联可能易受因果倒置影响
疾病或其前驱状态可能通过多条途径影响实际或测量到的暴露。
对于易出错的自报暴露,因果倒置会导致回忆偏倚——疾病的存在影响了实际暴露或测量/报告的暴露。
对于生物标志物,当疾病在测定时已存在,疾病过程可能改变暴露指标,进而产生因果倒置。
此时,所测暴露状态不仅可能与病因学相关的真实暴露不符,指标本身也会因疾病存在而发生偏移。这与回忆偏倚在生物学层面上的对应——疾病扭曲了自报暴露。针对某些生物标志物,取决于药动学特征及暴露随时间的变化幅度,即便同期测量的暴露指标,也可能对历史病因学时期具有信息价值。
要判断研究易受因果倒置影响的程度,需对具体的暴露和疾病类型及其相互关系进行仔细审视。
建议与结论
在评估流行病学研究用于推断因果关系的有效性时,务必考虑那些可能导致关联度量与因果效应产生偏离的特定偏倚,而不是默认这些偏倚必然存在并贬低研究价值。
应始终审视以下要点:
暴露与疾病之间的时间先后关系;
暴露归属的准确性(包括回忆偏倚和因果倒置的可能性);
以及将患病率用作发病率代理的充分性。
充其量,“横断面研究”这一标签只是提示需要对上述问题进行深入检视。
正如将横断面研究自动归咎于某些特定偏倚是不正确的,同样错误的还有:认为纵向研究天然就不会出现这些偏倚,或认为随机临床试验总优于观察性研究,亦或认为病例–对照研究的信息价值低于队列研究。
了解研究设计固然能提出具体问题,但并不能直接给出答案;应当避免假设存在一种普适的因果推断有效性等级体系。
参考文献:
David A Savitz, Gregory A Wellenius, Can Cross-Sectional Studies Contribute to Causal Inference? It Depends, American Journal of Epidemiology, Volume 192, Issue 4, April 2023, Pages 514–516,
来源:郑老师讲统计