摘要:然而,ctDNA的极低浓度使得检测MRD面临诸多挑战。此外,研究表明,利用新子(neomers)作为循环游离DNA(cfDNA)的生物标志物在MRD检测中同样展现出一定潜力
*仅供医学专业人士阅读参考
基于ctDNA和neomer特征的无创监测方法为NSCLC提供新的预后评估工具。
肺癌是全球最常见的恶性肿瘤之一,也是最常见的癌症死亡原因。非小细胞肺癌(NSCLC)约占所有肺癌病例的80%-85%
[1]
。尽管局部不可手术的NSCLC患者通常会选择接受化疗和放疗(CRT)联合治疗,但其预后依然不佳,5年生存(OS)率令人忧虑[2,3]
。因此,检测识别微小残留病灶(MRD)以促使早期预后评估并调整治疗方案显得尤为重要。
循环肿瘤DNA(ctDNA)作为由肿瘤细胞释放到血液中的非侵入性生物标志物,可用于预测疾病进展
[4]
。然而,ctDNA的极低浓度使得检测MRD面临诸多挑战。此外,研究表明,利用新子(neomers)作为循环游离DNA(cfDNA)的生物标志物在MRD检测中同样展现出一定潜力[5]。近期,Cancer Medicine杂志发表了一项研究,采用超灵敏液体活检方法对474个癌症相关基因进行了靶向测序,旨在探索非侵入性液体活检在CRT后NSCLC患者中对ctDNA的长期监测潜力以及其对复发风险的评估能力[6]。本文特此整理,以飨读者。图1 研究封面
研究设计及方法
患者招募和样本收集
2018年5月至2020年11月期间,研究共纳入了59例NSCLC患者。研究采用的化疗放疗(CRT)方案是基于铂类的双药联合方案,包括顺铂加依托泊苷、卡铂加紫杉醇或顺铂加培美曲塞(仅限于非鳞状细胞癌)等组合。研究者在不同的时间点收集外周血样本,用于通过靶向下一代测序(NGS)分析474个与癌症相关的基因以及全基因组测序。
在排除了在血浆样本收集时出现疾病进展(PD)事件的患者以及因肝/骨转移或个人原因而接受化疗而非CRT/放疗(RT)的患者后,共获得了44例患者的治疗后血浆样本。研究者在患者PD前的三个不同时间点评估了血浆样本中的ctDNA状态:分别为治疗期间(TP1:CRT/RT的第四周)、治疗后里程碑(TP2:CRT/RT完成后1个月)以及治疗后纵向(TP3:CRT/RT完成后3个月)。具体来说,39例患者在TP1时,32例在TP2时,25例在TP3时接受了评估。除了ctDNA结果外,研究者还收集了详细的病理和临床反应数据,以供后续分析。患者中位随访时间为26.4个月。
Neomer机器学习模型
研究者对WGS数据的原始读取进行修剪,将处理后的读取与人类基因组(GRCh37/hg19)进行比对以去除来自参考基因组的常见变异。为构建模型,研究者采用了新定义的neomer特征。研究者还对PCAWG数据库进行了调查,从2577个癌症患者样本中识别出了977个重复出现的单核苷酸多态性(SNPs)。从这些重复的SNP中,我们提取了4616个长度为16个碱基对的neomer。随后,使用全基因组变异数据库(gnomAD v2)将这些neomers与常见的种群变异数据进行过滤,最终得到了1758个neomers。针对每个血浆样本,扫描FASTQ数据以寻找与1758个目标neomer的16 bp长度完全匹配的序列,并将neomer特征定义为neomer检测到的读取与总读取数量的比值,以及每个neomer的读取计数。
为了开发MRD预测模型,44例患者收集了总共97个血浆样本,包括39个TP1样本、33个TP2样本和25个TP3样本,如图1所示。针对每个时间点,采用生存支持向量机(sSVM)算法构建了三个机器学习模型。
图2 研究队列和设计流程图
三个模型均采用留一交叉验证(LOOCV)策略进行了性能评估。在LOOCV过程中,除了留出的第i个样本外,对整个数据集构建了N(TP1:39,TP2:33,TP3:25)个交叉验证模型。使用训练好的交叉验证模型,研究者为被排除的第i个样本预测MRD风险。在获取所有样本的风险评分后,通过选择一个截止值来确定MRD状态以确保90%的特异性。
关键研究结果
患者特征
在此前发表的结果中,观察到患者群体几乎均分为腺癌(ADC)患者(45.5%)和鳞状细胞癌(SCC)患者(50.9%)[7]。此外,患者大多数(87.3%)为局部晚期疾病。MRD检测的机器学习模型
既往研究发现,在CRT后各时间点(TP1、TP2和TP3),复发患者的突变总读取比率显著高于未复发患者(见图3)。突变总读取比率是指突变读取数与总读取数的比例。此外,正如预期的那样,复发患者的癌症信号在TP1到TP3之间逐渐上升,并且在TP3时,复发患者与未进展患者之间存在统计学显著差异(p=0.025)。
图3 不同时间点的neomer特征模式
neomer模型在不同时间点均表现出一致的高性能。TP1时的模型敏感性为40%(95%Cl,21.1%–61.3%),特异性为92.9%(95%Cl,66.1%–99.8%)。TP2时模型的敏感性为40%(95%Cl,19.1%–63.9%),特异性为92.3%(95%Cl,64%–99.8%)。TP3时模型的敏感性为45.5%(95%Cl,16.7%–76.6%),特异性为92.9%(95%Cl,66.1%–99.8%)。
表1 neomer模型和基于突变的ctDNA方法的性能
此外,sSVM算法在三个时间点的表现均优于其他算法,均在目标90%特异性截止值下(如表2所示)。
表2 目标90%特异性下不同算法的性能评估
图4A显示模型能够提供稳定的预测效能。在TP1时,neomer模型显示出高风险患者的风险约为低风险患者的3.6倍(HR=3.62,95%Cl,1.49–8.81,p=0.0026)。在TP2时,该模型显示出风险约为3.9倍(HR=3.91,95%Cl,1.54–9.92,p总体而言,生存曲线显示,模型在不同时间点都能够保持区分高风险患者的能力(平均HR=3.84,标准差=0.19,见图4)。
图4 模型对于无进展生存期(PFS)的预测分析
图5 放射学确认复发前的neomer模型预测和ctDNA检测状态
将模型预测的结果与ctDNA突变分析的结果进行比较后发现,基于ctDNA变化的方法在TP1时敏感性为40%(95%Cl,21.1%–61.3%),特异性为78.6%(95%Cl,49.2%–95%);TP2时敏感性为45%(95%Cl,23.1%–68.5%),特异性为100%(95%Cl,75.3%–100%);TP3时敏感性为18.2%(95%Cl,2.28%–51.8%),特异性为85.7%(95%Cl,57.2%–98.2%)。
此外,模型与基于ctDNA突变的方法之间存在显著重叠,表明对高风险患者的预测具有相互一致性(如图6所示)。TP3时,neomer模型识别出6名高风险患者,而突变分析检测到4名ctDNA阳性患者,其中2名患者被两种方法均预测为高风险,neomer模型的敏感性比突变分析高出2.5倍(见表1)。此外,neomer模型在三个时间点与基于ctDNA突变的方法显示出良好的一致性,Cohen's Kappa值分别为TP1:0.2800(95%Cl,0–0.5979),TP2:0.5416(95%Cl,0.2189–0.8645),TP3:0.2574(95%Cl,0–0.6941)。
图6 提高检测疾病进展高风险患者的敏感性
在不同时间点,ctDNA阳性患者的复发风险显著波动:TP1时风险增加约2.1倍(HR=2.08,95%Cl,0.92–4.73,p=0.074),TP2时增加约9.5倍(HR=9.47,95%Cl,3.06–29.3,p相比之下,neomer模型预测的高风险患者风险更为稳定。
ctDNA突变分析在所有患者及三个时间点的表现均不及neomer模型。在所有患者中,neomer模型预测了19例高复发风险患者,而突变分析检出18例ctDNA阳性患者;在三个时间点的患者中,neomer模型预测6例高风险患者,突变分析检出7例ctDNA阳性患者,两者敏感性相似。在TP1和TP2时,neomer+突变因素是影响复发风险的最显著因素(TP1: p=0.007;TP2: p=0.004),但在TP3时不显著(p=0.117)。年龄在TP2时也是显著影响因素之一(p=0.013)。
此外,结合neomer模型和ctDNA突变分析的方法在三个时间点均提高了敏感性,同时保持了相似的特异性。联合模型在TP1、TP2和TP3的敏感性分别为60%、55%和54.5%,特异性分别为78.6%、92.3%和85.7%。联合方法的整体准确性在三个时间点均高于单独使用neomer模型或ctDNA突变方法,显示出临床应用上的潜力。
综合三个时间点的数据,联合模型的敏感性达到77.8%,特异性为70.6%,高风险患者的风险是低风险患者的4.51倍(HR=4.51,95%Cl,1.77–11.51,p=0.0007)。在三个时间点均有数据的19名患者中,联合模型的敏感性更是高达88.9%,特异性为80%,高风险患者的风险是低风险患者的13.37倍(HR=13.37,95%Cl,1.63–109.4,p=0.0022)。自助法分析(n=1000)进一步证实了整合模型在预测患者复发风险方面的优势和准确性。
研究意义与展望
总体而言,本研究基于无创液体活检技术,通过监测NSCLC患者CRT后的ctDNA,成功评估了其作为预后标志物的潜力。利用血浆样本中的neomer特征,研究开发了一种超灵敏测定法,为无法手术的局限性NSCLC患者提供了一种新的监测和复发风险评估手段。这种方法不仅无需预先获取肿瘤样本,而且通过结合neomer和机器学习模型,显示出优于传统突变检测的预测能力。
同时,研究存在样本量小和缺乏独立验证队列等局限性,期待未来通过增加样本量和建立多中心合作,克服当前研究局限,进一步增强预测模型的稳健性和适用性,旨在为NSCLC患者提供更全面和精准的预后信息参考。
来源:医学界肿瘤频道一点号