OpenAI推出Codex应用的GPT5，抢夺应用市场机会

摘要：OpenAI 于周一宣布，将为其 AI 编程工具 Codex 推出新版 GPT-5。该公司表示，这款名为 “GPT-5-Codex” 的新模型，其 “思考” 时间的分配比前代模型更具动态性，完成一项编程任务的耗时可从几秒到 7 小时不等。

OpenAI 于周一宣布，将为其 AI 编程工具 Codex 推出新版 GPT-5。该公司表示，这款名为 “GPT-5-Codex” 的新模型，其 “思考” 时间的分配比前代模型更具动态性，完成一项编程任务的耗时可从几秒到 7 小时不等。

目前，GPT-5-Codex 已开始在 Codex 系列产品中逐步推出。用户可通过终端、集成开发环境（IDE）、GitHub 或 ChatGPT 访问该工具，且所有 ChatGPT Plus、Pro、Business、Edu 及企业版（Enterprise）用户均可使用。OpenAI 称，未来计划向 API 客户开放该模型的使用权限。

OpenAI希望在与 Claude Code、Anysphere 旗下的 Cursor、微软 GitHub Copilot 等其他 AI 编程产品展开竞争。当前市场中，AI 编程工具市场的竞争已愈发激烈。2025 年初，Cursor 的年度经常性收入（ARR）突破 5 亿美元；而另一款类似代码编辑器 Windsurf 则成为多方竞购的焦点，OpenAI 表示，GPT-5-Codex 的表现均优于普通 GPT-5：一是衡量智能体编程能力的基准测试 SWE-bench Verified，二是针对大型成熟代码库中代码重构任务的性能测试。

可以说，在AI工具应用方面，各大巨头都是不遗余力地进行创新和不断地技术迭代。有人说，GPT-5-Codex最颠覆性的突破，是让AI首次拥有了自主分配"思考时间"的能力。在SWE-bench Verified基准测试中，这个特性使其以74.5%的准确率超越GPT-5的72.8%，更在代码重构任务中实现碾压——51.3%对33.9%的得分差距，相当于资深工程师与初级开发者的能力鸿沟。这种差距的根源，在于传统AI模型像刚入行的新人，无论任务难易都匆匆交卷，而新版Codex学会了像专家一样判断：简单的API调用几秒完成，复杂的算法优化则投入数小时迭代。

OpenAI的动态时间分配机制显然也是从实际应用出发，不同于传统路由机制在任务初期就固定资源分配，GPT-5-Codex能在处理过程中实时调整策略。正如产品负责人恩比里科斯所言："它可能在5分钟后决定需要再投入1小时，这种灵活性让AI首次具备了处理开放性编程问题的能力。"在实际测试中，模型会对复杂任务进行多轮测试-反馈循环，甚至会主动重构代码结构，这种"自我纠错"能力使其错误评论率从GPT-5的13.7%骤降至4.4%。

这种变革直击编程痛点。在追求"秒级响应"的AI时代，GPT-5-Codex的7小时模式显得格格不入，却意外解决了编程效率的核心矛盾。传统AI工具虽快但质量堪忧，某调查显示开发者平均要花40%时间修正AI生成的错误代码。而新版Codex通过延长思考时间，将"高影响力建议"占比从39.4%提升至52.4%，每个PR的平均评论数从1.32条降至0.93条，大幅减少了来回修改的内耗。

可以说，AI不仅完成了代码生成，还自主编写了符合ISO 26262安全标准的测试用例。过去需要安全专家审核两周，现在Codex花5小时生成的测试套件直接通过认证。这种效率提升来自模型对任务本质的深刻理解——它知道哪些地方需要慢下来，哪些可以快速处理。

开发工具链的深度整合放大了这种优势。GPT-5-Codex与VS Code的无缝衔接，使其能在IDE中完成从代码生成、测试到PR提交的全流程。有开发者分享，通过分阶段指令（先建端点、再加认证、最后写测试），12小时内完成了原本需要三周的用户系统开发。这种效率并非来自速度，而是AI具备了类似人类的项目管理能力。可以说，GPT-5-Codex的推出，将AI编程工具的竞争推向了新维度。当Claude-3.5在PaperBench综合测试中领先时，OpenAI选择在编程垂直领域构筑壁垒。

相比通用大模型，GPT-5-Codex的分词器针对代码场景优化，增加空格专用token使代码表示效率提升30%；推理机制采用核采样技术，遇到关键语法自动终止，避免无效代码膨胀。这种针对性设计使其在处理Python、Go甚至冷门的OCaml语言时都游刃有余，重构任务的跨语言兼容性评分比竞品高27%。当然，也有批评者指出，7小时的响应时间不适合敏捷开发，而按计算时长计费的模式可能增加成本。更深刻的挑战在于人机协作模式的重构——当AI能独立完成复杂任务时，开发者的角色将从编码者转型为需求定义者和结果审核者。

从秒级响应到小时级思考，GPT-5-Codex的时间革命揭示了AI发展的新规律：真正的智能不在于速度，而在于判断何时该快、何时该慢。当AI开始像人类专家一样分配时间，当12小时的深度工作能替代三周的重复劳动，编程行业的效率标准和人才需求都将被重新定义。或许，未来的程序员考核，可能不再是敲代码的速度，而是给AI提需求的精准度。在这场静默的革命中，时间不仅是度量效率的单位，更成为AI理解复杂世界的新维度。

来源：刀马物语

标签：应用 openai codex gpt5 codex应用

本文地址：http://news.43b.com.cn/a/1167519.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!