摘要:该成果发表于国际顶级期刊《Nature Methods》,标志着我国在AI驱动的生命科学研究领域实现重大突破,为解码细胞"生命语言"、加速精准医疗发展提供革命性工具。
该成果发表于国际顶级期刊《Nature Methods》,标志着我国在AI驱动的生命科学研究领域实现重大突破,为解码细胞"生命语言"、加速精准医疗发展提供革命性工具。
该研究旨在构建单细胞转录组学领域的基础模型(Foundation Model),以解析细胞分子层面的“语言”,推动生物医学研究。单细胞RNA测序(scRNA-seq)数据提供了高分辨率的细胞转录组信息,但面临数据分散、基因维度高(约2万蛋白编码基因)、技术噪音(如测序深度差异)等挑战。
scFoundation
研究团队提出世界首个大规模单细胞预训练模型scFoundation,基于超过5000万单细胞转录组数据训练,覆盖人体所有已知细胞类型及不同状态(正常、疾病、肿瘤等),目标是学习基因共表达模式、细胞间关系及跨测序技术的通用表征,为下游任务提供基础支持。
该模型首次证明单细胞数据足以支撑生物大模型的训练,其涌现出的跨任务泛化能力,将重塑从靶点发现到临床转化的全链条研发范式。
scFoundation预训练原理及其下游应用场景
在这一学术工作之外,百图生科已在其商业化版本基础大模型中提供了更为专业的版本,并正扩大模型规模至百亿参数、拓展至多组学联合建模等新的能力。期待与全球合作伙伴共建“细胞级生命模拟器”,加速实现疾病机制解析-药物设计-疗效预测的智能闭环。
百图生科落户在SISPARK的“IT+BT”(生物计算)融合创新中心。中心重点培育覆盖生命健康和信息技术融合产业链上下游的早期创新型项目,全力打造新型生物计算产业集群,致力于打造成为我国信息技术和生命健康融合创新核心“发源地”。
来源:科学吐槽大汇