摘要:今日,Nature发文报道了 DeepMind 最新推出的通用科学人工智能体 AlphaEvolve。 AlphaEvolve 是在他们2013年提出的 FunSearch 系统基础上发展而来。它不仅能在人类尚未解决的数学问题上超越人类,并且能够处理更大规模的
导语
今日,Nature发文报道了 DeepMind 最新推出的通用科学人工智能体 AlphaEvolve。 AlphaEvolve 是在他们2013年提出的 FunSearch 系统基础上发展而来。它不仅能在人类尚未解决的数学问题上超越人类,并且能够处理更大规模的代码,并在更多复杂算法和广泛的科学领域具有普适性。AlphaEvolve 还帮助团队改进了下一代张量处理单元,找到了更高效利用 Google 全球计算资源的方法。部分研究者表示有被 AlphaEvolve 的表现惊艳到,另有一部分学者则期待体验开源版本来评估它的实际效用。
上海科学智能研究院、集智科学研究中心和阿里云联合发布了《 AI × Science十大前沿观察 》,梳理出35个研究前沿,其中包括 基于LLM的科学研究 , AI科学家 专题对智能体在科学与计算领域的发展进行了回顾与展望,欢迎你来阅读。
研究领域:AI,大语言模型
图 1. 白皮书封面
AlphaEvolve:用于科学与算法发现的通用AI智能体
https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/AlphaEvolve.pdf。
Google DeepMind 利用聊天机器人模型提出了解决数学和计算机科学重大难题的方案。这一名为 AlphaEvolve 的系统,将大语言模型 (LLM) 的创造力,与能够评估模型输出、筛选并优化解法的算法相结合。该系统在公司于 5 月 14 日发布的一份白皮书中进行了阐述。“这篇论文相当惊艳,”德国埃朗根马克斯·普朗克光学科学研究所人工科学家实验室负责人 Mario Krenn 说,“我认为 AlphaEvolve 是基于通用型 LLM 实现新发现的首个成功示例。”伦敦 DeepMind 科学负责人 Pushmeet Kohli 表示,除了用该系统发现开放数学问题的解法外,DeepMind 已将这一人工智能技术应用于自身的实践挑战。
AlphaEvolve 帮助改进了公司下一代张量处理单元(TPU——专为 AI 研发的计算芯片)的设计,并找到了更高效利用 Google 全球计算资源的方法 ,节省了 0.7% 的整体资源。“它产生了显著影响,”Kohli 说道。
图 2. DeepMind公司称,AlphaEvolve帮助改进了人工智能芯片的设计,但尚未对公司外部的研究人员开放。图片来源:Christian Ohde/IMAGO via Alamy
迄今为止,AI 在科学领域的大多数成功应用,包括蛋白质设计工具 AlphaFold,都采用了为特定任务专门手工打造的学习算法,Krenn 说道。但 AlphaEvolve 是通用型的,它利用大语言模型 (LLM) 生成代码的能力,在广泛的领域中解决问题。
DeepMind 将 AlphaEvolve 称为“智能体(agent)”,因为它涉及多个 AI 模型之间的交互。 但它所针对的科学流程环节,与许多其他“智能体式”AI 科学系统不同,后者多用于文献综述和假说生成。
AlphaEvolve 构建于 DeepMind 自家的 Gemini 系列 LLM 之上。 每项任务都由用户输入问题、评估标准和初步解法,LLM 随后提出数百乃至数千种修改方案。然后,“评估器”算法根据优良解法的度量标准(例如,在分配 Google 计算任务时希望尽量减少资源浪费)对这些方案进行打分。 DeepMind 的 AI 科学家、该研究的联合负责人 Matej Balog 表示,LLM 会基于最优方案继续提出新思路,随着时间推移,系统就演化出一组更强大的算法。“我们探索了一系列多样化的问题解决可能方案。”他如此描述。
图 3. AlphaEvolve 发现流程。用户提供初始程序(并在其中标记待迭代的部分)、评估代码和可选配置。AlphaEvolve 随即启动进化循环。Prompt 采样器从程序数据库中抽取程序,构建丰富的提示。基于这些提示,LLM 生成代码修改,并应用于创建新程序。然后,评估器对这些新程序进行打分,并将表现优异的解法重新注册回程序数据库,从而推动程序的迭代优化,发现更佳的解决方案。
Balog 指出,AlphaEvolve 是在公司 2023 年推出的 FunSearch 系统基础上发展而来;后者曾用类似的进化方法在人类尚未解决的数学问题上超越人类。与 FunSearch 相比,AlphaEvolve 能处理更大规模的代码,并在更多复杂算法和广泛的科学领域中发挥作用。
DeepMind 表示, AlphaEvolve 还提出了一种矩阵乘法的计算方法,在某些情况下比 1969 年德国数学家 Volker Strassen 提出的最快算法更快 。矩阵乘法是将数字按网格相乘,广泛用于神经网络训练。尽管 AlphaEvolve 是通用性的,它在矩阵运算方面的表现仍优于 2022 年 DeepMind 专为矩阵运算设计的 AI 工具 AlphaTensor。 这一方法可用于解决各类优化问题,或任何在科学中存在“具体度量”或“仿真评估”以判断解法优劣的场景。 这还可能包括新型显微镜、望远镜甚至材料的设计.
图 4. 使用 AlphaEvolve 发现的打破最先进水平(SOTA)的数学构造示例。AlphaEvolve 的多功能性能够解决: 分析学 中的自相关与不确定性不等式问题; 几何学 中的填充与最小/最大距离问题; 组合数学 中的 Erdős 最小重叠问题以及有限集的和与差问题。
牛津大学数学家兼 AI 研究员 Simon Frieder 表示,在数学领域,AlphaEvolve 似乎能显著加速某些问题的解决。但他认为,它大概只会应用到那些可以“通过代码来表述”的有限任务上。其他研究者则 对该工具的真正效用持保留态度,认为要等到它在 DeepMind 以外的环境中经受考验后才能下定论 。“在系统被更广泛的社区测试之前,我会保持怀疑,并对报道的结果持保留态度,”美国俄亥俄州立大学的 AI 研究员 Huan Sun 这样说。Frieder 也表示,他会等到研究者们重现出一个开源版本,而不依赖可能随时变动或下线的 DeepMind 专有系统。
DeepMind 科学主管 Pushmeet Kohli 说,尽管 AlphaEvolve 的运行算力需求低于 AlphaTensor,但它仍然过于耗费资源,不适合免费托管在 DeepMind 的服务器上。不过,DeepMind 希望通过发布这套系统,激励研究者们提出更多可将 AlphaEvolve 应用于各种科学领域的想法。“我们非常希望让科学界尽可能多的人都能使用到它,”Kohli 说道。
来源:小夭看天下