可代做分享:基于双参数MRI评估深度学习前列腺癌检测系统

B站影视 日本电影 2025-05-17 03:46 2

摘要:·现状问题:前列腺癌的临床显著性(csPCa)检测主要依赖多参数MRI(mpMRI),但需要较高专业水平,PI-RADS评分存在主观性且在不同中心、一线和专家之间一致性较差。

往期推荐:

·现状问题:前列腺癌的临床显著性(csPCa)检测主要依赖多参数MRI(mpMRI),但需要较高专业水平,PI-RADS评分存在主观性且在不同中心、一线和专家之间一致性较差。

·研究动因:深度学习(DL)技术被证实在医疗影像分析中有很大潜力,但大多数研究模型较少与非专家放射科医生直接比对,也甚少基于公开数据集,影响可重复性和推广性。

·目标:本研究旨在评估一种基于bpMRI的前列腺癌深度学习自动检测系统,并将其与非专家放射科医生的诊断表现进行比较验证。

·数据来源

o训练集:来自全球9家机构的4381 bpMRI病例(包括3800阳性与581阴性病例),20%用GS分级,80%用PI-RADS标准。

o测试集:328例公开的PROSTATEx数据集,所有病例均有病理级别的GS标注,并按PI-CAI标准处理。

·DL模型:采用3D nnU-Net,对bpMRI(T2w、DWI、ADC)序列联合训练,输出包含癌灶概率的热力图。

·对比基线

o由4位有4年以上经验的非专业放射科医生单独阅片,使用mpMRI和PI-RADS评分。

·评估指标

o病例水平:AUC(ROC曲线下面积)

o灶水平:灵敏度、精度、FROC(自由响应ROC)、不同GS等级和肿瘤体积分组的灵敏度

o统计分析:使用1000次bootstrap生成置信区间,Mann-Whitney检验p≤0.05为显著。

·总体表现

oDL模型AUC达0.83(95% CI: 0.80-0.87),在0.5 FP/volume时灵敏度0.85,在1 FP/volume时达0.88,平均精度0.55。

·与放射科医生对比

o在同等假阳率下,DL模型的真阳率(TPR)均高于四位非专家放射科医生。例如于PI-RADS ≥3/≥4阈值下,TPR分别为0.93/0.79(DL),而放射科医生为0.87/0.68,差异有统计学意义。

o灶级灵敏度DL模型普遍高于人工阅片,尤其对于中—大体积(>650 mm³)病灶,灵敏度超过0.90。

·小病灶挑战:对于小于650 mm³的病灶检测,DL模型和人工阅片均存在较大挑战,DL模型灵敏度降至0.65。

·多亚组分析:各GS等级组下,DL灵敏度均大于0.85,表现稳定。

1.小病灶识别有待提升:DL模型在小体积或早期病灶检测方面表现不足,后续可结合序列丰富性或更多定量参数优化。

2.训练与测试标注一致性限制

o部分负例标注仅依赖PI-RADS,缺失长期随访、PSA密度数据,可能存在标注偏倚。

o测试集分配由单个放射科医生完成,缺乏多阅片员对同一病例的交叉标注。

3.数据泛化性待增强:尽管测试集来自独立机构,但厂家(Siemens)与部分训练集重合,理想情况下需更多多源、多厂商的数据验证模型泛化能力。

4.临床前瞻性验证不足:本研究为回顾性分析,后续需前瞻性、多中心临床应用验证其真实效能。

5.深度模型透明性与可解释性:建议未来强化DL模型的可解释性输出,辅助放射科医生理解AI决策过程。

该图展示了我们基于bpMRI的深度学习模型的输出预测结果,并将其与放射科医生在四个测试病例中的表现进行了比较。输入的序列包括T2加权像 (T2-w)、表观扩散系数 (ADC) 以及b值为1500的扩散加权成像 (DWI)。结果与金标准进行比较。病例A和B展示了癌症病例(具有3+4 GS病灶),深度学习模型准确预测了高概率区域,其空间位置与金标准病灶相匹配,而放射科医生却遗漏了这些病灶。病例C是放射科医生在前列腺外周带中部识别出的假阳性PI-RADS 3病灶,而模型未预测到病灶。该病例接受了活检,结果为阴性。病例D是一个阴性病例,放射科医生和模型都预测了一个假阳性病灶。放射科医生在前列腺外周带后外侧识别出一个假阳性PI-RADS 3病灶,而深度学习模型在同一位置预测了一个高概率区域。该患者通过MRI随访3年确认为阴性,未进行活检以完全确认无癌症。

来源:影像诊断小札记

相关推荐