秒解复杂规划难题,成功率85%!科学家用“AI+数学求解器”一句话生成最优解

B站影视 日本电影 2025-04-04 21:35 1

摘要:先看一个案例。有一家咖啡公司正在优化自身的供应链,这家公司需要从三家供应商采购咖啡豆,在两座烘焙厂加工成深度烘焙或浅度烘焙,然后再把烘焙好的咖啡配送到三个零售点。不同供应商的固定产能存在差异,而且烘焙成本和运输成本也会因地点不同而有所变化。

先看一个案例。有一家咖啡公司正在优化自身的供应链,这家公司需要从三家供应商采购咖啡豆,在两座烘焙厂加工成深度烘焙或浅度烘焙,然后再把烘焙好的咖啡配送到三个零售点。不同供应商的固定产能存在差异,而且烘焙成本和运输成本也会因地点不同而有所变化。

面对即将到来的销售旺季,公司需要在满足预计 23% 需求增长的前提下,找到最省钱的运营方案。

这时候直接问 ChatGPT 能解决问题吗?虽然这样的大语言模型在文本处理方面表现出色,但当遇到需要精确计算的复杂规划问题时,它们往往力不从心,给出的方案可能漏洞百出。

推理模型或许可以解决这类供应链优化问题,但实际应用中也存在几个不足之处,比如难以处理复杂约束条件、应对问题变化的适应性欠佳,计算效率低,难以找到最优解。

对此,麻省理工学院的科研团队独辟蹊径,他们没有选择改造大语言模型本身,而是开发了一个“智能规划助手”框架。

这个框架的工作原理非常巧妙,它先引导大语言模型像经验丰富的“项目经理”那样,把复杂问题拆解成原料采购、生产加工、物流配送等多个模块;然后自动调用专业的数学优化求解器,精确计算出每个环节的最优解。

用户只需要用日常语言描述问题即可,比如“用最省钱的方式把咖啡从产地送到门店”,完全不需要学习复杂的建模语言或提供大量示例。

这套系统会将用户的文本描述编码成优化求解器可解析处理的格式,而这个求解器就是专门为高效解决棘手的规划难题而设计的。

在整个问题转化过程中,大语言模型会像“校对员”一样进行复查。首先确认是否准确理解了用户需求,然后验证数学表达是否正确,最后评估解决方案是否可行。比如,发现烘焙厂的产能计算有误,它会自动调整参数重新计算,而不是给出一个超产能的方案。

研究团队用九类复杂场景测试该框架,比如优化仓库机器人任务路径,其成功率达到了 85%,而最佳基线的成功率仅为 39%。研究人员表示,这套系统(多功能框架)可广泛应用于多步骤规划场景,包括航空公司排班、工厂设备调度等。

“我们的框架就像是规划问题的智能顾问,既懂行业术语又能做精密计算,即使面对复杂规则或特殊需求,也能找出满足所有条件的最优方案。” 麻省理工学院信息与决策系统实验室(LIDS)的研究生、该研究论文的主要作者 Yilun Hao 说道。

这项研究成果将在国际学习表征会议上发表。研究论文的共同作者还有麻省理工学院 - IBM 沃森人工智能实验室的研究科学家 Yang Zhang,以及麻省理工学院航空航天学副教授兼 LIDS 首席研究员范楚楚。另外,这项研究工作部分由海军研究办公室和麻省理工学院 - IBM 沃森人工智能实验室资助。

优化算法“从入门到精通”

在现实世界中,许多关键决策都涉及‌海量变量‌的复杂组合。比如,航空公司如何安排上千架飞机的航线,物流公司怎样规划数万件包裹的配送路线等等。这些问题的共同点是:‌每个选择都可能会影响整体效率‌,而人工计算最优解几乎不可能。

一直以来,范楚楚和团队专注研究的组合优化算法,破解这类包含海量关联变量的复杂决策问题。

想象一下,如果一个供应链问题可能涉及十余个供应商、数个工厂、数十个仓库‌,每个环节都有不同的成本、产能限制,那么可能的组合方案会达到‌天文数字‌。

人类面对这类问题时,通常会先‌缩小范围‌(比如排除明显不划算的选项),再在剩余方案中寻找最优解。

研究团队开发的算法求解器也遵循这个思路,但能处理远超人类计算能力的超复杂问题。比如在数秒内评估数百万种可能性,并精准锁定‌成本最低、效率最高‌的方案。

不过,这类专业求解器也存在一个明显短板,即学习门槛较高,通常只有专家才能驾驭。

“我们的设想是,让大语言模型化身普通用户的‘翻译官’,成为使用这类专业求解器的桥梁。在实验室里,我们会把领域专家提出的问题转化为求解器能处理的格式,那我们能不能教会大语言模型做同样的事呢?”范楚楚说道。

于是,研究人员开发了这种“基于大语言模型的形式化编程(LLMFP)”框架,用户只需提供问题的自然语言描述、任务背景信息以及目标查询即可。

紧接着,LLMFP 会促使大语言模型对问题进行分析,确定构成最佳解决方案的决策变量和关键约束。

在将信息编码为优化问题的数学公式之前,LLMFP 会要求大语言模型详细说明每个变量的要求。它会编写代码对问题进行编码,并调用额外的优化求解器,进而得出理想的解决方案。

范楚楚打了个比方:“这和我们在麻省理工学院给本科生讲授优化问题的方式有些类似。所谓‘授人以鱼不如授人以渔’,我们不只是传授某一领域的知识,而是教他们方法。”

只要输入正确,求解器就一定能给出正确答案;如果结果出错,那么问题肯定出在转化环节。

为确保找到可行方案,LLMFP 会进行“自我检查”:分析求解结果,修正转化过程中的错误步骤。通过自检的方案,最终会以通俗易懂的自然语言呈现给用户。

完善方案

“这套自检机制不仅能发现错误,还能让大语言模型自动补全初次分析时遗漏的隐含约束条件。”Yilun Hao 表示。

这种能力就像是一个经验丰富的顾问,能够注意到新手容易忽略的关键细节。比如,在优化咖啡店供应链时,人类都知道咖啡店不可能运送“负数”的烘焙咖啡豆,但大语言模型在初次分析时可能会忽略这个常识性的约束。

此时,自检环节就会及时标记出这个逻辑漏洞,并指导模型进行修正。这种自我完善的能力,使得系统可以不断优化自己的分析框架。

“更智能的是,大语言模型还能根据用户偏好进行调整。”范楚楚补充说,“比如,当模型了解到某位商务人士不愿意更改既定的差旅时间和预算时,它就会像一位私人助理,优先调整其他参数来满足需求。”这种灵活应变的能力,让系统能够真正理解并尊重用户的个性化需求。

在一系列测试中,他们的框架在使用多个大语言模型处理 9 个不同规划问题时,平均成功率达到 83% - 87%。虽然部分基线模型在某些问题上表现更优,但 LLMFP 的总体成功率大约是基线技术的两倍。

与其他方法不同,LLMFP 无需特定领域的示例进行训练,“开箱即用”也能快速找到规划问题的最佳解决方案。除此之外,用户可以通过调整输入给大语言模型的提示,让 LLMFP 适配不同的优化求解器。

“大语言模型为我们打开了一扇门,让普通人也能跨领域使用专业工具,以全新视角解决问题。” 范楚楚总结道。

未来,研究人员希望让 LLMFP 能够支持图像输入辅助描述规划问题,这将有助于框架解决那些难以用自然语言完整表述的任务。

参考链接:

1.https://news.mit.edu/2025/researchers-teach-llms-to-solve-complex-planning-challenges-0402

2.https://arxiv.org/pdf/2410.12112

来源:麻省理工科技评论APP

相关推荐