摘要:研究概述1乳腺癌患者预后差的主要原因之一是耐药性。癌细胞虽能独立于线粒体能量代谢维持生存,但新 DNA 链合成依赖线粒体功能,这暗示线粒体能量代谢与耐药性间可能存在联系。本研究旨在评估耐药性和线粒体能量代谢相关差异表达基因(DMRDEGs)作为乳腺癌生物标志物
发表杂志名称(英文名):Journal of Translational Medicine
online 时间:2025 年 1 月 30 日
研究概述1乳腺癌患者预后差的主要原因之一是耐药性。癌细胞虽能独立于线粒体能量代谢维持生存,但新 DNA 链合成依赖线粒体功能,这暗示线粒体能量代谢与耐药性间可能存在联系。本研究旨在评估耐药性和线粒体能量代谢相关差异表达基因(DMRDEGs)作为乳腺癌生物标志物或治疗靶点的可行性。研究人员利用数据库确定 DMRDEGs,通过多种分析方法构建并验证了包含四个 mRNA 的乳腺癌预后模型。结果显示该模型能有效预测患者预后,其中 AIFM1 基因可增强乳腺癌细胞的增殖、迁移和侵袭能力,并通过降低耗氧量帮助癌细胞获得耐药性。总之,DMRDEGs 有望成为乳腺癌的诊断标志物和治疗靶点,AIFM1 可能是一个有前景的治疗靶点。
图 1:差异基因表达分析:
通过对 TCGA 数据库中 1118 个 BRCA 样本和 GEO 数据库中 477 个 BRCA 样本进行分析,利用 DESeq2 包进行差异分析,发现 3492 个差异表达基因(DEGs),其中 2125 个上调,1367 个下调(图 1A)。将 DEGs 与耐药相关基因(DRGs)和线粒体能量代谢相关基因(MRGs)相交,确定了 15 个 DMRDEGs,并绘制了维恩图(图 1B)。这些基因包括 ATP7B、SIRT6 等。通过热图对比了不同组中 DMRDEGs 的表达情况(图 1C-D),相关性热图展示了 DMRDEGs 之间的关系(图 1E),染色体定位图显示多个 DMRDEGs 位于 2、10 和 13 号染色体上(图 1F)。本图全面展示了差异表达基因分析的结果,确定了关键的 DMRDEGs 及其在不同组中的表达差异和染色体定位情况。
图 2:TCGA-BRCA 中 DMRDEGs 的突变分析:
对 15 个 DMRDEGs 进行突变分析,发现 TCGA-BRCA 中的主要体细胞突变为错义突变、无义突变等,DMRDEGs 主要以单核苷酸多态性(SNPs)为主,C>T 是最常见的单核苷酸变异(图 2A)。所有 15 个 DMRDEGs 都存在体细胞突变,PTEN 基因的突变率最高(图 2B)。通过箱线图和堆叠柱状图展示了突变类型(图 2C),相关性热图显示了 DMRDEGs 之间的突变关联(图 2D)。从 KM 曲线可知,携带突变的样本与更差的 DSS 预后相关(图 2E)。GISTIC2.0 分析表明所有 15 个 DMRDEGs 都存在拷贝数变异(CNV)(图 2F)。该图详细呈现了 DMRDEGs 的突变特征、突变相关性、与预后的关系以及 CNV 情况。
图 3:DMRDEGs 的 GO 和 KEGG 富集分析:
通过 GO 和 KEGG 富集分析,发现 15 个 DMRDEGs 主要富集在负调控运输、调节激素分泌等生物学过程,小窝、质膜筏等细胞成分,NAD + 结合、碳水化合物激酶活性等分子功能,以及 AMPK 信号通路、癌症中的中央碳代谢等信号通路。联合 logFC 的 GO 和 KEGG 富集分析结果通过柱状图、气泡图、弦图和圆形图展示(图 3A-D)。此图揭示了 DMRDEGs 在生物学过程、细胞成分、分子功能和信号通路方面的富集情况,为理解其功能提供了依据。
图 4:DMRDEGs 的共识聚类分析:
对 15 个 DMRDEGs 进行共识聚类分析,确定了两种不同的 BRCA 亚型:亚型 1(Cluster 1)和亚型 2(Cluster 2)(图 4A-C)。亚型 1 包含 865 个样本,亚型 2 包含 253 个样本。箱线图显示了 DMRDEGs 在两种亚型中的表达差异,SIRT6、FUS 等多个基因在不同亚型中的表达差异显著(图 4D)。该图表明基于 DMRDEGs 可将 BRCA 分为不同亚型,且这些基因在不同亚型中的表达存在显著差异。
图 5:TCGA-BRCA 数据集的 GSEA 分析:
利用 GSEA 对 TCGA-BRCA 中所有基因的表达进行分析,发现所有基因在 NIKOLSKY BREAST CANCER 7Q21 Q22 AMPLICON、DACOSTA UV RESPONSE VIA ERCC3 DN 等生物学功能和信号通路中显著富集(图 5A-D)。通过绘制山脉图可视化了这些通路(图 5E),表明富集与免疫相关功能和通路有关。本图展示了基因表达水平对乳腺癌亚型的影响,以及相关的生物学功能和信号通路富集情况。
图 6:TCGA-BRCA 的 GSVA 富集分析:
对 TCGA-BRCA 数据集中的所有基因进行 GSVA 分析,筛选出 logFC 为正和负的前 10 条通路,热图展示了每个样本的富集分数(图 6A),箱线图进行了组间比较(图 6B)。结果显示正 logFC 值的通路包括 HALLMARK E2F TARGETS 等,负 logFC 值的通路包括 HALLMARK TGF BETA SIGNALING 等。此图揭示了不同乳腺癌亚型在基因集富集方面的差异,为进一步了解亚型特征提供了信息。
图 7:CIBERSORT 算法的免疫浸润分析:
利用 CIBERSORT 算法计算 22 种免疫细胞与乳腺癌亚型 1 和亚型 2 的相关性,绘制了免疫细胞的叠加柱状图(图 7A)和分组比较箱线图(图 7B),结果显示多种免疫细胞在两种亚型中的浸润丰度存在显著差异。相关性热图展示了免疫细胞浸润丰度之间的相关性,T 细胞 CD8 与调节性 T 细胞(Tregs)的正相关性最强,静息 NK 细胞与活化 NK 细胞的负相关性最强(图 7C)。相关性点图和散点图显示了 DMRDEGs 与免疫细胞浸润丰度的相关性,IL1B 与活化肥大细胞的正相关性最强,ATP7B 与 M1 巨噬细胞的负相关性最强(图 7D-F)。该图全面分析了免疫细胞在不同乳腺癌亚型中的浸润情况以及与 DMRDEGs 的相关性。
图 8:不同 BRCA 簇之间的 ESTIMATE 分析:
使用 ESTIMATE 包分析不同疾病亚型的表达谱数据,得到基质评分、免疫评分等。组间比较图显示基质评分和免疫评分在不同疾病亚型中存在显著差异,而 ESTIMATE 评分和肿瘤纯度在不同亚型中无显著差异(图 8A-D)。此图表明不同乳腺癌亚型在基质评分和免疫评分方面存在差异,有助于了解肿瘤微环境的特征。
图 9:IPS、TMB 和 TIDE 分析:
从 TCIA 数据库检索与 TCGA-BRCA 相关的 IPS,绘制组间比较图,发现 CTLA4 (-) PD1 (+)、CTLA4 (+) PD1 (-) 和 CTLA4 (+) PD1 (+) 亚型在 IPS 分类中差异显著(图 9A-D)。不同乳腺癌亚型的 TMB 评分存在显著差异(图 9E),TIDE 算法评估显示乳腺癌患者对免疫治疗的敏感性在不同亚型中的 TIDE 评分无显著差异(图 9F)。该图评估了乳腺癌亚型对免疫治疗疗效的预测能力,包括 IPS、TMB 和 TIDE 评分的差异分析。
图 10:药物敏感性分析:
从 GDSC 数据库获取乳腺癌患者对常见抗癌药物的敏感性数据,评估两种乳腺癌亚型之间的药物敏感性差异。结果显示 MK.2206、Lapatinib 等 20 种药物在两种亚型组间存在显著差异(图 10A-T)。此图为乳腺癌患者寻找合适的 mRNA 疫苗治疗方法提供了参考,确定了在不同亚型中敏感性差异显著的药物。
图 11:PPI 网络:
利用 STRING 数据库构建包含 15 个 DMRDEGs 的 PPI 网络,发现 15 个 DMRDEGs 中有 14 个存在相互作用(图 11A)。GeneMANIA 数据库揭示了这些 DMRDEGs 的相关基因(图 11B)。该图展示了 DMRDEGs 之间的蛋白质相互作用关系以及相关基因,有助于理解基因的功能和调控网络。
图 12:DMRDEGs 的 LASSO 分析:
进行 LASSO 逻辑回归分析,确定了四个关键基因:ATP7B、FUS、AIFM1 和 PPARG,并构建了风险评分计算公式(图 12A-B)。根据风险评分中值将样本分为高风险和低风险组,比较关键基因在不同风险组中的表达,发现几乎所有关键基因在 TCGA-BRCA 和联合数据集中的表达差异显著,ATP7B、FUS 和 PPARG 在低风险样本中高表达,AIFM1 在高风险样本中高表达(图 12C-E)。风险因子图显示乳腺癌的 LASSO 模型在 1 年时准确性较高,3 年和 5 年时准确性相对较低(图 12F)。本图通过 LASSO 分析筛选出关键基因,评估了其在不同风险组中的表达差异和模型的预测准确性。
图 13:关键基因和风险评分的生存分析:
根据四个关键基因的表达水平和风险评分对 TCGA-BRCA 进行分组,绘制生存预后 KM 曲线。结果显示高风险评分组和低风险评分组的生存预后存在显著差异,低风险评分组预后更好(图 13E)。AIFM1 高表达组和低表达组、ATP7B 高表达组和低表达组的生存预后也存在显著差异(图 13A-D)。该图表明关键基因和风险评分与乳腺癌患者的生存预后密切相关。
图 14:Cox 回归的预后模型:
评估风险评分与临床病理特征的关系,发现风险评分在不同临床病理特征组中存在显著差异(图 S1)。通过 Sankey 图展示了各种临床病理特征之间的关系(图 14A),单因素 Cox 回归分析筛选出相关因素并进行多因素 Cox 回归分析,绘制柱状图展示各因素对预后模型的贡献(图 14B-C)。绘制预后校准曲线和决策曲线分析(DCA)评估模型的准确性和实用性,结果显示模型准确性高,AIFM1 基因是最显著的贡献因素(图 14D-E)。此图构建并验证了 Cox 回归的预后模型,明确了影响预后的关键因素和模型的性能。
图 15:AIFM1 在乳腺癌细胞系中的作用实验验证:
Western blot 分析证实成功敲低 AIFM1(图 15A)。集落形成实验表明敲低 AIFM1 显著抑制 MDA-MB-231 和 HCC1806 细胞的增殖(图 15B-C)。划痕实验和 Transwell 实验显示敲低 AIFM1 导致肿瘤细胞的迁移和侵袭能力显著下降(图 15D-G)。OCR 测量表明 AIFM1 表达水平与细胞呼吸呈反比(图 15H)。CCK-8 实验表明下调 AIFM1 增强了 Lapatinib 的抗肿瘤疗效(图 15I)。该图通过实验验证了敲低 AIFM1 对乳腺癌细胞恶性表型和耐药性的影响。
研究总结1本研究旨在探索耐药性和线粒体能量代谢相关差异表达基因(DMRDEGs)作为乳腺癌生物标志物或治疗靶点的潜力。研究人员通过整合多个数据库的数据,确定了 15 个 DMRDEGs,并对其进行了全面分析。通过多种生物信息学方法和实验验证,构建并验证了包含 ATP7B、FUS、AIFM1 和 PPARG 四个基因的预后模型,该模型能有效预测乳腺癌患者的生存情况。功能实验表明 AIFM1 可促进乳腺癌细胞的增殖、迁移和侵袭,并帮助癌细胞获得耐药性,敲低 AIFM1 可减轻肿瘤细胞的恶性表型和降低耐药性。虽然研究存在一定局限性,如数据来源于公共数据库、AIFM1 在体内的生理作用有待进一步研究,但总体而言,DMRDEGs 有望成为乳腺癌诊断和治疗的重要靶点,为乳腺癌患者的分层、准确预后评估和个性化治疗提供了有价值的数据。
来源:老郑说科学