Nat Commun丨刘瑾团队开发创新RNA速度分析方法SDEvelo

B站影视 2025-01-06 17:50 2

摘要:单细胞RNA测序 (single-cell RNA sequencing, scRNA-seq) 技术的发展让我们能够在单细胞水平上研究基因表达,但由于测序过程的破坏性特点,研究人员只能获得某一时间点的”快照”,难以追踪细胞发育的动态过程。虽然RNA速度分析方

单细胞RNA测序 (single-cell RNA sequencing, scRNA-seq) 技术的发展让我们能够在单细胞水平上研究基因表达,但由于测序过程的破坏性特点,研究人员只能获得某一时间点的”快照”,难以追踪细胞发育的动态过程。虽然RNA速度分析方法 (RNA velocity analysis) 可以通过比较未剪切RNA (unspliced RNA) 和已剪切RNA (spliced RNA) 的比例来预测细胞的瞬时发展方向,但现有方法往往忽视了多基因间的多变量建模,且对转录动力学中的随机性考虑不足,可能导致细胞命运方向的错误预测。

近日,香港中文大学 (深圳) 数据科学学院刘瑾课题组与武汉大学焦雨领课题组在Nature Communications发表了题为Multivariate stochastic modeling for transcriptional dynamics with cell-specific latent time using SDEvelo的研究文章,该研究开发了一种名为SDEvelo的创新RNA速度分析方法,通过多变量随机微分方程建模的方式,实现了对细胞转录动态过程的精确预测,为理解细胞命运决定提供了强大的研究工具。

针对这些挑战,刘瑾团队开发的SDEvelo方法实现了三大创新突破:首次引入多变量随机微分方程模型,可以同时分析多个基因的动态变化;采用非线性可微函数描述转录率变化,更符合实际生物学过程;充分考虑了转录过程中的随机波动。然而,求解非线性耦合的多变量微分方程系统一直是该领域的重大挑战。传统基于ODE的方法依赖显式解,而对于非线性耦合的多变量SDE系统,获得显式解是极其困难的。更具挑战性的是,由于测序技术的破坏性,真实的单细胞数据缺乏时间信息,这使得传统参数估计方法难以应用。为解决这些关键问题,SDEvelo创新性地采用生成式对抗学习策略(图1),不仅克服了显式解难以获得的技术瓶颈,还能在缺乏时间信息的情况下有效表征转录过程中的内在和外在随机性,显著提高了估计结果的可靠性。

图1 SDEvelo的算法流程

特别是在成熟细胞群体中,SDEvelo成功缓解了现有方法的错误预测问题。以外周血单核细胞 (PBMC) 为例,当细胞达到稳态时,其mRNA水平趋于平衡,理论上不应表现出明显的发育方向。然而,现有方法如scVelo等往往错误地预测出强烈但任意的方向性。相比之下,SDEvelo通过多基因协同建模和考虑随机噪声,准确识别出了成熟细胞群中的随机动态模式,避免了假阳性的发育轨迹预测。

此外,为展示SDEvelo在实际生物医学中的潜力,刘瑾团队深入分析了肝细胞癌 (HCC) 的空间转录组学数据 (spatial transcriptomics, ST) 。他们利用来自同一患者的四个组织切片 (包括两个肿瘤切片和两个癌旁切片) ,揭示了基质区域向肿瘤/正常上皮 (TNE) 区域的过渡趋势(图2)。特别是在癌旁组织中,SDEvelo识别出一系列与癌症进展相关的关键驱动基因,如多个载脂蛋白 (APO) 家族基因。这些基因在肿瘤邻近组织中表现出显著的动态变化,暗示它们可能在肝癌发生过程中起到重要作用。这一发现不仅展示了SDEvelo在复杂生物系统中的应用价值,也为深入理解肝癌发生机制提供了新思路。

图2 SDEvelo揭示肝癌发生机制

通过真实数据集的验证,SDEvelo展现了广泛的适用性。在小鼠胚胎重编程数据中,SDEvelo准确重建了细胞命运的决定路径,展示了其在发育生物学领域的应用潜力。这项开创性的研究不仅开发出了一种新的分析工具,更为理解细胞命运决定机制提供了崭新的视角。该方法 已在GitHub开源并提供了详细的使用文档https://github.com/Liao-Xu/SDEvelo和模拟及真实数据的代码教程https://sdevelo.readthedocs.io/en/latest/。

制版人:十一

BioART战略合作伙伴

(*排名不分先后)

BioART友情合作伙伴

来源:科学小课堂

相关推荐