前谷歌CEO押注,初创开源240亿参数模型,主打类药物分子设计

B站影视 内地电影 2025-06-06 19:30 2

摘要:今年 5 月,一家名为 FutureHouse 的非营利组织宣布推出一款名为 Robin 的新型人工智能(AI)工具,声称其能够极大加速生物学等领域的科学研究进程,该系统不仅能够自主完成从假设提出、实验设计到数据分析等关键科研环节,更在实际应用中,仅历时约 2

今年 5 月,一家名为 FutureHouse 的非营利组织宣布推出一款名为 Robin 的新型人工智能(AI)工具,声称其能够极大加速生物学等领域的科学研究进程,该系统不仅能够自主完成从假设提出、实验设计到数据分析等关键科研环节,更在实际应用中,仅历时约 2.5 个月便成功为干性年龄相关性黄斑变性这一复杂眼疾发现了一种新的潜在治疗药物。

不到一个月的时间,FutureHouse 于近日开源发布了 240 亿参数的推理模型 ether0,该模型尤其擅长设计类药物分子,它能接收自然语言提问,用自然语言进行推理,最终输出分子结构。

研究人员对 FutureHouse 的进展既兴奋又担忧。“我认为他们取得的成果非常酷,”德国耶拿大学的 Kevin Jablonka 教授说道。在使用 ether0 的预览版时,Jablonka 发现该模型能够对未经训练的化学性质做出有意义的推断。“这令人印象深刻,之前的模型都做不到。”

图 | 要求模型在一定的约束条件下构建一个化合物(来源:FutureHouse )

这家由前谷歌 CEO Eric Schmidt 支持的组织创立于 2023 年,总部位于美国加州旧金山市。由首席执行官 Sam Rodriques 和科学主管 Andrew White 联合创立,其宏伟愿景是构建能够自主进行科学研究的“AI 科学家”或 AI 系统,从而加速疾病治疗方法的发现、气候变化解决方案的探索以及其他推动人类社会发展的技术创新。

此前,FutureHouse 已经推出了一系列专门用于自动化科学发现过程中特定环节的 AI 智能体(AI Agent),例如用于文献搜索与综合的 Crow、Falcon 和 Owl,用于化学合成设计的 Phoenix,以及用于复杂数据分析的 Finch。

Robin 系统则成功将这些独立的 AI 智能体(主要是 Crow、Falcon 和 Finch)整合到一个统一的工作流程中,实现了整个科学研究过程中关键智力步骤的自动化。其成功为干性年龄相关性黄斑变性这一复杂眼疾发现了一种新的潜在治疗药物。

当今顶尖大语言模型(如 OpenAI o3)已掌握大量化学知识,在 ChemBench、GPQA 等化学基准测试中甚至超越人类专家水平。它们能流畅讨论吸电子基团特性,或解析酰胺偶联反应的后处理步骤。然而,这些模型在实际分子操作层面表现欠佳:难以准确计算分子中的氧原子数量,常提出不合理的环状结构,且分子命名能力薄弱。

FutureHouse 的研究人员推断,由于现代大语言模型的权重中已存储大量化学原理的潜在知识,只需施加少量强化学习训练,就能显著提升其在分子操作任务中的表现。

为了验证这一假设,FutureHouse 的研究人员从法国初创公司 Mistral AI 于 2025 年初发布的 Mistral 24B 模型入手,通过多轮强化学习与微调相结合的方式进行训练。

与传统的化学教材训练方式不同,研究人员创新性地采用“考试学习法”:FutureHouse 的化学工程师 Andrew White 团队从 45 篇学术论文中提取实验室数据(包括分子溶解性、气味等特性),将其转化为577,790道可验证的化学试题。

研究团队通过让基础模型“出声思考”:分析 DeepSeek-R1 生成的错误解决方案与推理链,进行初步训练。随后,7 个专项模型版本分别攻克特定化学问题子集,通过正确答案获得强化奖励。最终将这些专业模型的推理链融合,形成通用模型。再次运行试题集后,最终得到了 ether0。

图 | ether0 的训练过程(来源:FutureHouse )

性能测试显示,ether0 在全新试题集上全面超越 GPT-4.1、DeepSeek-R1 等前沿模型,某些题型准确率甚至达到竞品的两倍以上。更惊人的是其训练效率:要达到相同反应预测精度,传统非推理模型需要消耗 50 倍以上的数据量。

ether0 的突破性不仅限于化学领域,相较于前沿大模型,其参数量级显著精简(240 亿参数),且每个任务仅需约 5 万样本进行训练。这种可扩展的训练规模使其具备跨科学领域应用的潜力。

但 Jablonka 教授指出局限:“ether0 仅能输出分子式和反应式,难以在独立基准测试中与其它模型或人类表现直接对比。”不过他也发现,该模型能正确推理未训练过的分子结构(如根据核磁共振谱调整分子式),这种泛化能力超出预期。

(来源:FutureHouse)

Rodriques 的愿景远不止于开发智能计算工具。他坚信,将推理能力植入专业智能体将实现端到端的全流程科研自动化,这一变革不仅限于化学领域。尽管 FutureHouse 计划优先发展化学方向,团队预期其他研究机构会将此方法推广至整个自然科学领域。

关于语言模型能否在训练后强化学习阶段获得新能力,学界一直存在争议。本研究首次证实:模型可以掌握预训练中完全未接触过的新任务(如“官能团识别”任务)。最令人振奋的是,其中某项任务在监督微调初期准确率始终为 0%,直到第 100 训练步时突然出现正确预测,随后开始持续提升。这个关键实证为“语言模型何时或者如何获得推理能力”的学术争论提供了全新视角。

参考链接:

1.https://www.futurehouse.org/research-announcements/ether0-a-scientific-reasoning-model-for-chemistry

2.https://www.nature.com/articles/d41586-025-01753-1

免责声明:本文旨在传递合成生物学最新讯息,不代表平台立场,不构成任何投资意见和建议,以官方/公司公告为准。本文也不是治疗方案推荐,如需获得治疗方案指导,请前往正规医院就诊。

来源:生辉SciPhi

相关推荐