摘要:表型药物发现(Phenotypic Drug Discovery, PDD),是细胞命运调控研究和药物研发的经典核心策略,它能直接反映药物在真实细胞及生理 /病理环境中的实际作用,命中的化合物更易具备体内活性。过去表型筛药存在筛选成本高、机制溯源难、通量与临床
表型药物发现(Phenotypic Drug Discovery, PDD),是细胞命运调控研究和药物研发的经典核心策略,它能直接反映药物在真实细胞及生理 /病理环境中的实际作用,命中的化合物更易具备体内活性。过去表型筛药存在筛选成本高、机制溯源难、通量与临床相关性难以平衡等问题。随着AI技术与组学技术的发展,这一现状也正在发生改变。
2025年10月23日,来自Cellarity公司、亥姆霍兹联合会以及麻省理工学院的研究团队《Science》期刊上发表题为“Active learning framework leveraging transcriptomics identifies modulators of disease phenotypes”的研究论文。该团队提出的闭环主动强化学习框架,能通过转录组数据预测化合物表型活性,还可通过实验反馈持续优化筛选效率。
该团队其开发的DrugReflector主动强化学习模型,该模型以三个多层感知机分类器构成的集成深度学习模型,其训练严重依赖大规模标准化的药物扰动转录组数据,而这些数据核心就源自药物扰动图谱相关数据库。训练数据源自CMap等数据库的百万级药物扰动转录数据,覆盖近万种化合物、50种细胞系。完整记录了不同化合物扰动细胞后形成的基因表达特征(即转录组指纹)。训练过程中,团队还特别注重保留数据异质性,以单个扰动为独立输入,通过交叉验证筛选最优模型参数。
Fig.1 用于组学水平的深度学习模型进行表型发现的模块化框架
最终在基准测试中DrugReflector表现亮眼:在CMap Touchstone数据集上,较传统算法Dr.Insight 的平均召回率提升 15 倍以上;在原代细胞(如临床相关的 CD34+造血干细胞)中,仍能保持领先优势。更值得关注的是,在血液疾病筛选中,它将巨核细胞分化的化合物命中率提升17倍,红细胞祖细胞分化命中率提升13倍,后续结合闭环主动标记学习,命中率又进一步翻倍。这一系列突破的背后,正是 “大量高质量转录组数据” 提供的坚实支撑,没有足够的数据规模与多样性,模型的泛化能力和预测精度便无从谈起。
昕瑞再生自主开发的DRUG-seq2技术正是一款可以高通量、低成本产生高质量转录组数据的方法。该技术实现每周上万样本的超高通量药物扰动数据产出,单次实验可稳定检出1 万 + 转录组信息,不仅覆盖多种细胞类型,更能精准捕捉不同药物剂量、不同作用时间点的动态转录变化,完美解决了传统方法“耗时长、成本高、规模有限” 的痛点,为基于表型的药物筛选、细胞命运调控机制研究提供了高效、可靠的技术支撑。
我们目前已经打造首批即刻可使用数据库,包含基于人皮肤成纤维细胞,涵盖11786个样本(含对照)的转录组数据。如果您对我们的技术或者数据库感兴趣,欢迎咨询。
Fig.3即用数据库基本信息
联系方式
南京昕瑞再生医药科技有限公司
南京市江北新区磐固路16号
AI大模型与DRUG-seq2结合两大场景案例
一、药物筛选
Thiorphan促进脊髓损伤恢复的研究,需筛选“诱导皮质脊髓神经元再生”的化合物:
Fig.3基于模型精准发现促进脊髓损伤后功能恢复药物的技术路线图
其中前期步骤:明确再生转录组特征、计算机模型筛选对于数据的准确性以及数据维度有极高的要求,而基于DRUG-seq2技术的数据就可以带来不仅高于CMap的准确性还能有远大于CMap的基因维度数据。因此如果有DRUG-seq2数据支撑,用DRUG-seq2批量生成成年皮质神经元在不同药物扰动下的转录组数据,快速锁定“胚胎样再生转录组特征”对应的化合物,并将该数据用接下来的模型优化与验证,能更精准更高效的筛选出类似Thiorphan的有效化合物,显著提升皮质脊髓轴突再生效率。
二、细胞命运调控:17倍提速血小板减少症研究
基于细胞命运调控机制,针对免疫性血小板减少症(ITP)的治疗需求,需精准筛选可驱动 “CD34+造血干细胞向巨核细胞谱系定向分化” 的小分子调控剂,具体技术路径优化如下:
1.细胞命运扰动图谱生成(DRUG-seq2):采用 384 孔板培养体系,对 3 名供体来源的 CD34+造血干细胞进行体外培养,加入包含临床已知药物与全新分子实体的候选化合物库。通过孔特异性 barcode 标记技术,捕获药物介导的细胞命运转换动态,经培养生成上千个高分辨率药物扰动图谱,累计可产出上万个细胞命运调控相关的扰动数据,为后续精准建模提供基础。
2.细胞命运定向分化模型预测与验证:将上述扰动数据输入 DrugReflector 深度学习框架,模型基于 “巨核 - 红系祖细胞(MEP)向巨核细胞祖细胞(MPC)分化” 的核心细胞命运签名进行候选药物优先级排序,实现定向调控分子的高效筛选。湿实验验证结果显示,筛选出的 4 个活性化合物可使 CD41a+巨核细胞比例提升 3 倍,整体命中率达 19.6%—— 较传统随机筛选(1.1%)提升 17 倍,显著增强了CD34+造血干细胞向巨核细胞谱系的命运定向调控效率,为 ITP 治疗提供了高效的药物发现新路径。
无论是神经损伤等难治性疾病的药物研发还是基于细胞命运调控研究,DrugReflector 与 DRUG-seq2 的组合都展现出强大潜力。DRUG-seq2 提供的高质量、大规模转录组数据,为 DrugReflector 模型提供了精准 “燃料”,而模型则高效挖掘数据价值,加速药物发现与机制解析。这一 “数据生成 + 智能预测” 的模式,正重塑药物研发流程,为攻克更多疾病带来新希望。
参考文献
1:Benjamin DeMeo et al. ,Active learning framework leveraging transcriptomics identifies modulators of disease phenotypes.Science;
2:Ye C et al. DRUG-seq for miniaturized high-throughput transcriptome profiling in drug discovery. Nat Commun. 2018;
3:Li J, et al. Transcriptome-based chemical screens identify CDK8 as a common barrier in multiple cell reprogramming systems. Cell Rep. 2023.
4: van Niekerk, E.A., de Freria, C.M., Mancarci, B.O. et al. Thiorphan reprograms neurons to promote functional recovery after spinal cord injury. Nature 2025.
关于昕瑞再生
南京昕瑞再生医药科技有限公司成立于 2019 年,先后获中科创星、红杉资本两轮融资,依托北京大学分子医学南京转化研究院软硬件支持。公司核心团队源自北京大学,承载创始团队在干细胞、再生医学及小分子创新药领域 20 余年经验,搭建了世界领先的细胞表型药筛平台—— 整合细胞疾病模型、表型组学定量、AI 技术,聚焦 “细胞疾病 / 衰老表型逆转” 研发新药。
公司拥有自主知识产权的DRUG-seq2、PHDs-seq 高通量测序技术,已在早期药物发现、细胞毒性测试等场景见效,既服务自研项目,也为科研领域提供高质量技术解决方案。
来源:白兔讲科学
