摘要:2025年4月17日,OpenAI正式发布两款革命性AI推理模型——o3和o4-mini,标志着AI在多模态推理与自主任务执行能力上的跨越式突破。两款模型不仅首次实现“图像思维”,还能自主调用多种工具链,显著提升了复杂现实问题的解决效率。
人工智能领域又迎来的一次重大飞跃。
2025年4月17日,OpenAI正式发布两款革命性AI推理模型——o3和o4-mini,标志着AI在多模态推理与自主任务执行能力上的跨越式突破。两款模型不仅首次实现“图像思维”,还能自主调用多种工具链,显著提升了复杂现实问题的解决效率。
“当前人工智能正处于历史上第三次浪潮的新的拐点上,以ChatGPT的发布为分界线。”智源研究院院长王仲远告诉封面新闻记者,在此之前的人工智能可以将其称为弱人工智能,也就是针对特定场景、特定任务去收集特定数据训练出来的模型,不具备泛化性。“大语言模型从实验室走向产业界,有可能推动人工智能向通用人工智能的时代发展。”
技术亮点:图像思维与工具自主调用
封面新闻记者注意到,在两款o系列推理模型发布后,OpenAI首席执行官萨姆·奥特曼转发一名体验者的推文,并表示新模型“达到或接近天才水平”。此外,奥特曼还表示,预计会在未来几周内将o3升级到专业版o3-pro。
据OpenAI 介绍,o3和o4-mini首次将图像直接融入思维链中,实现了“用图像思考”的能力。用户可上传白板笔记、手绘草图、教科书图表等视觉内容,模型即使面对模糊、颠倒或低质量的图像,也能通过动态缩放、旋转等操作进行深入分析。例如,用户上传一张手写数学题的草图,o3可逐步拆解题意并输出完整的解题过程。
这一能力在多模态基准测试中表现尤为突出:在MMMU(大学级视觉问题解决)任务中,o3准确率达82.9%,远超前代o1的77.6%;在MathVista(视觉数学推理)测试中,o3以86.8%的准确率刷新纪录。
此外,自主工具调用与多任务协同也是该模型的一大亮点。两款模型能无缝调用ChatGPT的全套工具,包括网页搜索、Python编程、图像生成等,并支持通过API集成用户自定义工具。例如,当用户询问“加州夏季能源使用趋势”时,模型会自动搜索公共数据、编写代码预测趋势、生成可视化图表,并串联多个工具完成复杂推理。
OpenAI强调,模型的强化学习训练使其能自主判断工具使用时机与方式,显著降低现实任务中的错误率。在编程领域,o3在SWE-bench测试中得分69.1%,超过Anthropic的Claude 3.7 Sonnet(62.3%)。
性能表现 全面超越前代
在基准测试中,o3和o4-mini成绩可谓亮眼。
在AIME 2025数学竞赛中,o3和o4-mini分别以88.9%和92.7%的准确率领先o1的79.2%;在Codeforces编程竞赛中,o3与o4-mini的ELO评分达到2706和2719,远超o1的1891。
o3在博士级科学问答(GPQA Diamond)中的准确率达83.3%,而o4-mini在非STEM任务中表现同样优异。
此外,两款模型的成本与适用场景也进一步优化:o3定价为每百万输入/输出tokens 10/40美元,较前代o1降低33%;o4-mini则以每百万输入tokens 1.1美元的超低价格,成为高吞吐量场景的首选。ChatGPT订阅用户可免费使用两款模型,企业用户则在一周内获得访问权限。
封面新闻记者注意到,o3的“深度思考”模式支持长时间推理,适用于复杂科学问题求解。例如,生物学家可上传显微镜图像,模型能识别细胞结构并生成实验假设;工程师则能通过草图快速验证机械设计。
开源工具Codex CLI的同步发布,进一步降低了AI与本地代码库集成的门槛。开发者可通过终端直接调用模型执行编程任务,OpenAI还配套推出100万美元API资助计划,激励创新应用。
大模型竞争格局加速演变?
面对DeepSeek、Anthropic等对手的紧逼,OpenAI以“小步快跑”策略密集发布新模型。此前一天,其推出的GPT-4.1系列通过成本优化(如GPT-4.1 Nano每百万tokens仅0.12美元)应对价格战,而o3/o4-mini则专注高端推理市场。
尽管GPT-5因技术整合难题推迟发布,CEO山姆·奥特曼透露,o3/o4-mini将作为过渡模型填补空窗期,未来GPT-5将融合o系列推理能力与GPT系列的自然交互优势,实现技术路线统一。
OpenAI为两款模型重构安全训练数据集,新增生物威胁、恶意软件生成等风险防护机制。其开发的“推理LLM监控器”在生物风险检测中拦截率达99%,确保技术应用符合伦理规范。
OpenAI此次发布不仅巩固了其在AI领域的领先地位,更以“图像思维”与工具自主调用重新定义了智能边界。今年4月初,奥特曼在社交媒体上发文称,GPT-5的发布比预期要晚,因为“顺利整合所有内容比我们预想的要困难得多。”他表示,将在未来几周内发布o3和o4-mini,未来几个月将发布GPT-5,并强调GPT-5发布后会非常受欢迎,可能会有大量的用户使用,所以需要提前做好准备。
GPT-5发布的临近,生成式AI的下一幕竞争,即将拉开。
来源:乡间王小二