Nat Cell Biol | 邓攀等开发基于深度学习的细胞状态流形建模与驱动基因预测框架——CellNavi

B站影视 电影资讯 2025-10-04 10:09 1

摘要:细胞状态在正常发育、疾病进展和治疗响应过程中不断变化,而这些转变通常由少数关键基因(即“驱动基因”)主导。精准识别这些驱动基因,不仅有助于揭示复杂的生理机制和病理变化,还为靶向干预和药物开发提供了重要基础。然而,细胞状态的多样性、基因数量的庞大以及调控网络的复

细胞状态在正常发育、疾病进展和治疗响应过程中不断变化,而这些转变通常由少数关键基因(即“驱动基因”)主导。精准识别这些驱动基因,不仅有助于揭示复杂的生理机制和病理变化,还为靶向干预和药物开发提供了重要基础。然而,细胞状态的多样性、基因数量的庞大以及调控网络的复杂性,使得准确识别驱动基因成为生物学领域的一大挑战。

2025年10月3 日, 北京中关村学院资深研究员邓攀(原微软研究院高级研究员)及其同事 在Nature Cell Biology发表了题为CellNavi predicts genes directing cellular transitions by learning a gene graph-enhanced cell state manifold的研究论文,提出了一种全新的深度学习框架 CellNavi,用于识别驱动细胞状态转变的关键基因。通过引入基因调控图和细胞流形概念,CellNavi 为复杂生物学问题提供了强大的建模能力。

CellNavi 采用了两阶段建模策略。首先,研究团队通过细胞流形模型(Cell Manifold Model, CMM),利用约 2000 万条来自 Human Cell Atlas 的单细胞转录组数据,构建了一个能够反映细胞本质状态的低维流形。通过自监督的“下采样–重建”任务结合 bottleneck 机制,模型将高维的单细胞转录组数据压缩到一个低维坐标空间,使得该空间能够捕捉细胞的关键特征,并让坐标间的距离反映细胞状态的相似性。为了进一步增强 坐标空间的 生物学解释性和可靠性,CellNavi 引入了覆盖约 3 万个人类基因的 NicheNet 基因调控图。NicheNet 提供了丰富的先验信息,包括基因调控网络(GRN)和信号通路 等 。通过图注意力机制(GeneGraph Attention),这些调控信息被融入到 细胞 流形模型的学习过程中,使得低维空间不仅能够 更准确地 反映细胞状态的本质特征,还涵盖了基因调控网络的结构信息。 低维空间与流形的建立 有效压缩了转录组数据,显著增强了跨条件和跨细胞类型的泛化能力,为细胞状态 转变的下游分析 提供了重要支持。

在构建细胞流形的基础上,CellNavi 进一步训练了驱动基因预测器(Driver Gene Predictor, DGP)。利用大规模 CRISPR 扰动筛选实验数据,模型从未扰动 - 扰动细胞对中学习哪些基因最有可能引发特定的细胞状态转变。对于任意一对细胞状态,DGP 首先通过 CMM 获取其状态坐标,然后输出所有候选基因的驱动概率并生成预测排序。

a) CellNavi 概念 图:给定起始和目标细胞 状态(转录组形式) ,CellNavi 在细胞流形上预 测驱动该转变的基因。b) CellNavi 工作流程:细胞流形模型(CMM)将细胞映射到流形 坐标 空间,驱动基因预测器(DGP)根据 细胞 坐标对候选基因进行排序 。

在多个基准任务中,CellNavi 的表现 均 显著优于现有方法。例如,在 T 细胞 CRISPR 激活筛选数据集上,其 Top-1 准确率达到 62%,Top-5 准确率为 73%。即使在双基因扰动等复杂场景中,CellNavi 依然展现了卓越的预测能力。与基于基因调控网络的 SCENIC+ 等方法相比,CellNavi 的驱动基因预测范围已超越经典的转录因子-靶标基因关系,可以识别由任意基因主导的状态转变。这一能力使其在疾病进展、免疫应答和药物干预等多种背景中的应用潜力更为广泛。

值得注意的是,CellNavi 的预测并非简单依赖于基因表达量的变化。研究团队 发现,即使 系统排除被扰动基因的表达 信息 ,模型仍能准确识别驱动因子。例如,在神经退行性疾病模型中,CellNavi 成功识别出如 EIF2S1等 内质网压力(ER stress)关 键因子,尽管这些基因的表达量变化并不显著。这表明,CellNavi 能够捕捉深层次的调控因果关系。

CellNavi 还展现出卓越的跨任务迁移能力。在未使用任何药物数据的情况下,模型仅通过 CRISPR 基因扰动 数据的训练,便能准确推断 17 种 HDAC 抑制剂对细胞状态的影响机制。CellNavi 不仅能够区分不同药物的调控路径,还能揭示其下游通路的功能选择性(functional selectivity):例如,有些药物偏好调控 RNA 加工通路,而另一些则主要影响线粒体功能。这种机制层级上的细粒度差异常常难以通过传统 转录组分析 方法捕捉。

除此之外 ,CellNavi 在跨细胞类型的泛化任务 中 也 展现出了良好的表现。这意味着, CellNavi能够适应 真实世界中 异质背景下的细胞状态建模任务,进一步拓展了其实用性。

CellNavi 的监督训练数据(f)与应用和测试场景(g)

CellNavi 提供了一个统一、可扩展、具备跨条件泛化能力的细胞建模框架,不仅在常规任务中展现出领先性能,更在药物作用机制解析、疾病模型研究、跨系统泛化等高难度场景中展现出独特价值。其潜在应用场景包括发育生物学、免疫调控研究、复杂疾病机制解析以及药物靶点发现等领域。

白静云绘制

制版人: 十一

学术合作组织

战略合作伙伴

【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。

BioArt

Med

Plants

人才招聘

近期直播推荐

来源:小强科普社

相关推荐