新模型sPGGM:单样本水平,有效识别复杂疾病发展“临界点” | NSR

B站影视 电影资讯 2025-05-19 19:32 1

摘要:近日,《国家科学评论》(National Science Review, NSR)在线发表了华南理工大学的数学学院刘锐教授团队与佛山大学钟佳元博士的研究成果。

海归学者发起的公益学术平台

分享信息,整合资源

交流学术,偶尔风月

近日,《国家科学评论》(National Science Review, NSR)在线发表了华南理工大学的数学学院刘锐教授团队与佛山大学钟佳元博士的研究成果。

该研究基于最优传输理论和高斯图模型,提出了样本扰动高斯图模型(sPGGM),通过分析参照分布与扰动分布之间的动态差异,能够在单样本/细胞水平上有效分析疾病进展识别前疾病(临界)阶段,有效克服了传统方法在利用高维有限样本或单细胞数据识别临界转变时面临的挑战。

复杂疾病的发展过程通常可划分为三个阶段:相对正常阶段前疾病阶段疾病阶段(图1)。

图1 复杂疾病发展的三个阶段

前疾病阶段是疾病发生恶化的临界状态,一旦跨越该阶段,患者往往会经历灾难性且不可逆的病情恶化,从而对生命和健康构成严重威胁。因此,理解疾病进展的动态变化,特别是揭示前疾病阶段,对于早期干预和治疗具有至关重要的意义。

然而,准确识别复杂疾病的前恶化阶段或临界点面临很大挑战,因为相对正常阶段与前疾病阶段之间基因表达模式及临床表型的变化往往较为微小。此外,数据噪声、患者异质性以及样本量有限等因素,也影响了临界转变的可靠识别

该研究中,刘锐教授团队提出了一种创新的计算框架:样本扰动高斯图模型(sPGGM)。该方法基于最优传输理论和高斯图模型,通过分析参照分布与扰动分布之间的动态差异(图2),能够在单样本或单细胞水平上有效识别疾病进展中的临界点或前疾病阶段及其相关信号分子(图3),有效克服了传统统计方法在高维有限样本或单细胞数据中识别临界转变时面临的挑战。

图2 参照分布与扰动分布之间的动态差异。参照分布通过相对健康样本拟合得到,扰动分布由特定病例样本与相对健康样本组混合样本拟合得到。

图3 sPGGM:有效识别疾病进展临界点。基于最优传输理论和高斯图模型,sPGGM能够在单样本水平上量化参照分布与扰动分布之间的动态变化。

为了验证sPGGM的鲁棒性与有效性,刘锐教授团队将其应用于模拟数据(图4)以及结肠腺癌(COAD)、甲状腺癌(THCA)、肾透明细胞癌(KIRC)、子宫内膜癌(UCEC)、肾乳头状细胞癌(KIRP)和肝细胞癌(LIHC)等多种真实癌症数据的探测(图5)。

结果表明,sPGGM能够有效处理现实的疾病数据,准确识别不同疾病类型中的前疾病阶段,并挖掘相关的动态网络标志物(信号分子)。此外,与现有的单样本检测方法相比,sPGGM在捕捉复杂疾病的关键信号方面表现出更优的性能。

图4 基于仿真数据评估sPGGM性能。 (a) 仿真数据使用18节点调控网络进行产生。 (b) sPGGM值的急剧增加预警着即将发生的临界转变。 (c) sPGGM景观图表明,信号分子或动态网络标志物(DNBs)的特定局部网络score在系统接近临界点时表现出急剧增加。 (d)-(f) sPGGM比以往单样本方法具有较强抗噪性能。

图5 基于sPGGM识别癌症进展过程中的前疾病阶段。sPGGM和基因表达在六种不同肿瘤类型的表现: (a) 结肠腺癌(COAD)、(b) 甲状腺癌(THCA)、(c) 肾透明细胞癌(KIRC)、(d) 子宫内膜癌(UCEC)、(e) 肾乳头状细胞癌(KIRP)、(f) 肝细胞癌(LIHC)。sPGGM值的显著增大预警疾病恶化临界转变到来。

sPGGM作为一种新颖的单样本模型,不仅为复杂疾病的早期诊断提供了新的思路,也为个性化医疗和早期疾病干预与治疗提供了量化分析的工具。

华南理工大学数学学院刘锐教授和陈培教授为该论文共同通讯作者,佛山大学数学学院钟佳元博士与华南理工大学数学学院黎俊贤为论文共同第一作者。该工作得到了国家自然科学基金、广东省基础与应用基础研究基金等项目的资助。

扩展阅读

媒体转载联系授权请看下方

来源:知社学术圈

相关推荐