摘要:近日,国际期刊GigaScience发表了华大生命科学研究院等研究团队开发的新工具AEnet(Alternative Splicing-Gene Expression Network)。该工具能够利用单细胞RNA测序数据,系统性地分析基因的“可变剪接”事件,并
近日,国际期刊GigaScience发表了华大生命科学研究院等研究团队开发的新工具AEnet(Alternative Splicing-Gene Expression Network)。该工具能够利用单细胞RNA测序数据,系统性地分析基因的“可变剪接”事件,并推断这些事件与细胞功能(即“表型”)的潜在联系,为深入理解癌症、发育等过程中的细胞异质性提供了更精准的方法。
在生命体中,一个基因可以通过“可变剪接(Alternative Splicing, AS)”这种机制,产生多种不同的RNA异构体,从而可能编码功能各异的蛋白质。这个过程对细胞的身份和功能至关重要。
当前,单细胞RNA测序(scRNA-seq)技术让我们能够检测单个细胞中的RNA转录本。然而,绝大多数分析方法主要关注“基因的表达水平”,而对“可变剪接”的分析不足。这使得我们难以全面了解细胞群体在转录本多样性层面的细微差异,也限制了对其调控机制的深入解析。因此,开发新工具至关重要。
A. 可变剪接模式(ASP)的识别及 PSI 值计算示意图。B. AEnet 网络构建、多样本整合及 ASP 相似性计算示意图。C. AEnet 方法整体流程示意图
AEnet工具的核心突破在于,它将剪接信息作为解析细胞状态的主导因素,并与基因表达数据进行整合,系统构建“剪接-表型”关联图谱。
基于整合的剪接模式对细胞聚类:AEnet首先计算每个基因在每个细胞中的剪接形式(用量化指标PSI表示)。然后,它直接根据细胞之间剪接模式的相似性(整合基因表达数据)对细胞进行聚类,从而发现那些在传统基因表达分析中被掩盖的、具有功能异质性的细胞亚群。
关联剪接与表型并识别调控因子:在识别出基于剪接的细胞亚群后,AEnet会分析与细胞表型(如治疗反应)密切相关的关键剪接事件,并进一步识别调控这些关键剪接事件的剪接因子及其调控的功能通路。
系统揭示下游功能与机制:最后,通过生物通路富集分析及调控网络构建,AEnet可以系统揭示这些特定剪接事件所影响的生物学通路及其在疾病发生、发展中的潜在机制,从而建立从剪接变异到细胞表型的因果联系。
为了验证AEnet的实用性,研究团队将其应用于一组对免疫治疗反应不同的肺癌患者数据。
发现关键细胞群:AEnet成功识别出三个细胞亚群(S0, S1, S2)。其中,S2亚群在治疗无效的患者中显著增多,而S1亚群则富集于治疗有效的组织。这为临床疗效差异提供了来自剪接视角的细胞层面解释。
定位问题剪接事件:分析发现,一个名为C_4的“剪接模块”在S2亚群中异常活跃。该模块包含的基因主要参与炎症和免疫抑制通路,这与免疫治疗耐药的现象高度吻合。
锁定潜在调控因子:AEnet进一步预测出调控C_4模块的关键分子,包括已知的剪接因子CELF2和一个功能尚未明确的基因IK。它们的异常活动被推测是导致治疗失败的重要原因。
A. 基于AEnet细胞类型聚类结果的UMAP可视化。B. 反应组与AEnet细胞簇之间细胞重叠关系的桑基图。C. C_4 ASP剪接簇在不同细胞簇中的富集分数分布。D. C_4 ASP簇中具有可变剪接模式的基因所富集的前3条通路。E. CD74基因的可变剪接模式及其PSI(剪接百分比)在三个细胞簇中的分布,采用Student's t检验进行统计分析。F. 剪接因子在C_4 ASP簇形成中的重要性及其与簇的相关性(以颜色表示)。G. IK基因在不同细胞簇中的表达水平,采用Student's t检验进行统计分析。 图中显著性标记:p
综上,AEnet提供了一套系统性的解决方案,将单细胞分析从“看基因是否表达”推进到了“看基因如何被剪接”的新维度。它能够更精细地解析细胞异质性,并更直接地揭示细胞状态与疾病表型之间的关联。该工具已开源,有望在肿瘤学、发育生物学和疾病机制研究中发挥重要作用,并为发现新的药物靶点提供线索与候选目标。
西南华大生命科学研究院刘尚、基因组多维解析技术全国重点实验室陈茜为论文共同第一作者。基因组多维解析技术全国重点实验室吴靓研究员、刘石平研究员,三亚华大生命科学研究院白寅琪研究员为该论文共同通讯作者。本研究获得了重庆市科技创新重点研发计划、国家自然科学基金和深圳市科技计划的支持。
来源:阿新科学在线
