摘要:Nature刊登了多篇研究文章,这些文章聚焦在材料科学、生物医药、分子设计、疫情预测等科学研究的核心领域。
Nature刊登了多篇研究文章,这些文章聚焦在材料科学、生物医药、分子设计、疫情预测等科学研究的核心领域。
这些研究背后的共同点是:大语言模型正被用来“做科学”。
这引发了一个值得深入讨论的问题——大语言模型是否已经成为推动科学发现的新型工具?
6月,英国雷丁大学团队在《Nature Communications》上发表了一篇论文,提出了一个名为CrystaLLM的模型。
它的工作方式与传统晶体结构预测方法不同,是将晶体结构信息转化为一种类似自然语言的符号序列,由语言模型进行自回归生成。
论文作者Luis Antunes团队使用了数百万个标准晶体信息文件(CIF)作为训练数据。
模型训练完成后,能够基于一个初始提示,逐步生成符合物理规律的晶体结构,并通过从头模拟验证了其物理稳定性。
研究结果表明,在多个未见晶体结构的生成任务中,CrystaLLM生成的结果符合结晶学规范,具备良好的几何稳定性。
语言模型生成的结果确实在科学标准下站得住脚。
除了CrystaLLM模型,澳大利亚莫纳什大学团队提出了LLM4SD框架。
这一模型专注于分子属性预测任务,研究团队采用了“文献知识提取+分子结构推理”的思路。
研究团队将这些向量输入到传统的可解释模型(如随机森林)中,最终发现:模型不仅能给出预测结果,还能解释每一个决策背后的逻辑依据。
例如,含卤素的分子更易穿透血脑屏障,这一结论来源于文献推理,但得到了数据验证。
这种设计方式让语言模型不再只作为生成工具被使用。
大多数人对大模型的印象,仍停留在“实验室演示阶段”。
美国约翰·霍普金斯大学团队一项名为PandemicLLM的研究,让这个印象发生了改变。
研究内容是将传染病疫情预测任务,转化为一个基于文本推理的任务。
研究团队从美国50个州采集了104周的数据,整合了5200条时空分布记录,训练模型预测未来一到三周的住院趋势。
结果显示,PandemicLLM在多个指标上优于传统的时间序列模型,尤其在面对复杂变量交互时,预测更为稳定。
这种能力不限于疫情预测。
中国浙江大学的研究团队则从另一个角度给出了回答。
他们研发的SciToolAgent,基于一个知识图谱驱动的系统,可以调用、编排、执行超过200种科研工具,包括蛋白质工程、化学反应预测、合成路线规划等。
研究团队构建了一个名为SciToolKG的知识图谱,记录了每个工具的功能、输入输出要求和安全规范。
模型根据用户需求,自动生成工具链,并执行各项任务,最终生成结果报告。
在实际测试中,这一系统的表现优于传统手动配置流程。
这意味着,科研流程中的工具整合、任务执行,已经可以由模型部分完成。
大语言模型在多个科学领域的应用不断扩大。
CrystaLLM的晶体结构生成、LLM4SD的属性预测、PandemicLLM的疫情建模、SciToolAgent的科研流程自动化,大语言模型正在从语言生成工具转变为科学参与者。
语言模型正逐步成为科学发现的一部分。
它是通往新型科研范式的起点。
来源:妇产科医生小永