斯坦福大学华人团队打造首个通用生物医学AI智能体

B站影视 欧美电影 2025-06-10 19:21 1

摘要:然而,在生物医学实验室中,科研人员往往被复杂的实验方案、庞大的数据库、五花八门的分析工具以及不停更新的海量文献所淹没。生物医学研究日益受到这些重复且分散的工作流程的制约,让科研人员疲于奔命, 严重减缓了科学发现的速度,限制了科学创新。这凸显了科学界对根本性新方

生物医学研究是增进人类对健康和疾病的理解、推动药物研发以及提升临床护理水平的基础。

然而,在生物医学实验室中,科研人员往往被复杂的实验方案、庞大的数据库、五花八门的分析工具以及不停更新的海量文献所淹没。生物医学研究日益受到这些重复且分散的工作流程的制约,让科研人员疲于奔命, 严重减缓了科学发现的速度,限制了科学创新。这凸显了科学界对根本性新方法的迫切需求——一种能够 有效扩展科学专业知识、简化研究工作流程,并充分释放生物医学研究潜力的全新路径。

2025 年 6 月 2 日, 斯坦福大学 黄柯鑫 、 Serena Zhang 、 王瀚宸 、 屈元昊 、 陆荧洲 等研究人员领衔的团队,联合 Genentech、Arc Institute、 加州大学旧金山分校及 普林斯顿大学等 多个顶尖研究机构,发布了一款 通用生物医学 AI 智能体 —— Biomni ,该智能体能够自主完成横跨遗传学、基因组学、微生物学、药理学和临床医学等多个生物医学分支领域的复杂研究任务 。 Biomni 的诞生标志着 AI 在生物医学研究中从“工具使用者”向“自主决策者”的跃迁 。通过将分散的科研资源整合为可操作的 智能体行为单元 ,不仅破解了传统研究流程的碎片化瓶颈,更可能催生跨学科、高通量的自主 化科学发现引擎 。 该研究以: Biomni: A General-Purpose Biomedical AI Agent 为题,发表在了预印本平台 bioRxiv 上,研究团队在 biomni.stanford.edu 开放免费注册和使用 。

该研究开发的 Biomni 由两个核心组件构成—— Biomni-E1 和 Biomni-A1 (基于该环境的智能 体 ) 。

Biomni-E1 (统一的生物医学软件和数据环境) :研究团队选取了 2500 篇最新发表的论文(25 个学科类别,每个类别 100篇),利用行动发现大语言模型 智能体逐篇分析这些论文,提取复现或生成相关研究所需的关键任务、工具、数据库和软件资源。Biomni-E1 环境整合了 150 个专业生物医学工具、 105 个专业软件包和 59 个数据库。这些工具均经过人类专家严格验证,特别侧重于具有复杂特性的工具,包括复杂代码实现、领域专业知识或专用 AI 模型。

Biomni-A1 (通用智能 体架构 ) :采用了多项核心创新技术,确保其在生物医学研究领域的有效运行。首先,系统引入基于大语言模型的工具选择机制,专门应对生物医学工具的复杂性和专业性挑战,能够根据用户目标动态检索定制化的资源子集。其次,考虑到生物医学任务通常需要复杂的程序逻辑,Biomni-A1 采用代码作为通用行动接口,使其能够组合执行涉及循环、并行化和条件逻辑的复杂工作流程。第三,智能体运用自适应规划策略,基于生物医学知识制定初始计划,并在执行过程中持续优化改进。

为评估 Biomni 在真实研究任务中的泛化表现,研究团队精心设计了 8 个横跨 遗传学 、 基因组学 、 微生物学 、 药理学 和 临床医学 的全新生物医学基准测试,具体包括:变异优先级排序、 GWAS 因果基因检测、 CRISPR 扰动筛选设计、罕见疾病诊断、药物重定位、单细胞 RNA 测序注释、微生物组疾病 - 分类群关联分析以及患者基因优先级排序。

结果显示,在所有测试任务中, Biomni 展现出显著的性能优势:相较于基础大语言
模型提升 402.3% ,相较于编码智能体提升 43.0% ,相较于自身简化版本 Biomni-ReAct 提升 20.4% ,平均相对性能提升幅度令人瞩目。

实战检验——破解人体“餐后发热”之谜

面对 30 个人连续数月检测的 458 份血糖及体温数据,Biomni 自主生成并执行了一套十步分析流程:从葡萄糖峰值推断用餐事件,提取餐前 / 餐后温度窗口,进行跨个体标准化,并综合分析群体水平趋势,自主发现:

餐后一致的产热反应模式;

餐后平均体温上升 2.19 °C;

个体差异惊人:最低 -0.11 °C vs 最高 15.56 °C;

绘制出 4 类代谢表型图谱 (快速反应型/延迟型等) 。

实战检验—— 解码骨骼发育多组学数据

Biomni 分析了一个最近发表的人类骨骼发育多组学数据集,该数据集包含 336162 个单核 RNA 测序和 ATAC 测序数据点,自主规划并执行了一套十步分析流程,Biomni 能够:

预测转录因子-靶基因调控链接,并基于基序富集和染色质可及性相关性筛选调节因子;

重现了已知的关键成骨转录因子 (例如 RUNX2 、 HHIP ) 间的调控关系;

发现了 AUTS2、ZFHX3 和 PBX1 等 多个此前未被报告的转录因子在多种骨骼细胞了行中的调控作用;

实战检验:设计实验方案

研究团队进一步评估了 Biomni 在实际实验设计中的表现,重点测试其在分子生物学核心任务 —— 基因克隆 方面的能力, Biomni 生成的实验方案在准确性和完整性方面均达到人类专家水平,在实际湿实验验证中,科学家严格按照 Biomni 设计的方案操作,成功完成基因克隆实验,且测序结果显示序列完美匹配。在克隆 B2M 基因的任务中, Biomni 实现了:

100% 实验成功率 (Sanger测序验证) ;

精准设计了 BsmBI 酶切位点;

输出湿实验完整 protocol (退火温度/连接时长精确到秒) 。

总的来说,该研究推出了一款 通用型生物医学 AI 智能体—— Biomni ,旨在自主完成横跨生物医学多个分支领域的大规模研究任务。Biomni 通过 行动发现智能体 (Action Discovery Agent) ,从 25 个生物医学领域的 2500 篇最新文献 中挖掘关键工具、数据库与实验 protocol,首次建立起统一的智能体 环境 (Agentic Environment) 。基于此框架,Biomni 采用一种通用 型智能体架构 ,将大语言模型 (LLM) 的推理能力、检索增强式规划 (Retrieval-Augmented Planning) 代码驱动执行 (Code-Based Execution) 深度整合,使其能够动态组合并执行复杂的生物医学工作流程,完全摆脱了预定义模板或固定任务流程的束缚。 系统性基准测试表明,Biomni 在多个领域的生物医学任务中展现出强大的泛化能力,包括因果基因优先级排序、药物再利用、罕见病诊断、微生物组分析和分子克隆等,且无需任何特定任务的提示调整。真实世界的案例研究进一步展示了 Biomni 解读复杂多模态生物医学数据集以及自主生成可实验验证的方案的能力。 Biomni 在 药物发现 、 临床应用 和 消费者健康 领域均展现了强大的能力—— Biomni 设想了一个未来,在这个未来, 虚拟 AI 生物学家 将与 人类科学家 并肩工作,帮助增强人类科学家的能力,从而极大地提高研究效率、临床洞察力和医疗保健水平。

为了让每个研究人员都能使用 Biomni 的强大功能,研究团队开发了直观的网络平台——https://biomni.stanford.edu,用户只需提交自然语言查询,即可获得由 Biomni 智能体系统全面支持的分析结果,例如,只需输入“分析我的单细胞数据”,即可零代码操作。最后,研究团队诚邀科学家们探索其功能、测试其极限,并共同创造生物医学发现的新时代。

生物世界 对 Biomni 进行了测试,提问了: I want to identify new genes that regulate ferroptosis. Could you help me design an experimental plan or provide some ideas?

以下是 Biomni 的回答,大约耗时 5 分钟:

来源:东窗史谈一点号

相关推荐