OpenAI推出Codex AI代理来处理多步骤编码任务

摘要：据该公司称，Codex由codex-1提供支持，codex-1是OpenAI为软件开发优化的o3模型的变体，并在与GitHub集成的基于云的隔离环境中运行。

OpenAI最先进的人工智能编码代理Codex将为开发人员带来并行任务自动化——但分析师警告说，未经审查的速度会带来“无声的失败”。

OpenAI宣布发布Codex，这是一个人工智能编码代理，它表示旨在帮助软件工程师编写代码、修复错误和运行测试。

据该公司称，Codex由codex-1提供支持，codex-1是OpenAI为软件开发优化的o3模型的变体，并在与GitHub集成的基于云的隔离环境中运行。

最初向ChatGPT Pro、Enterprise和Team用户推出，OpenAI表示，它计划很快将访问权限扩展到Plus和Edu用户。

思科和Temporal等公司开始测试Codex进行调试和功能开发。然而，与实时编码助手相比，其任务持续时间（从1分钟到30分钟不等）和预期使用限制提出了关于工作流程效率和成本效益的问题。

与提供内联建议的GitHub Copilot不同，OpenAI的新代理可以自动执行多步骤任务。Anthropic的Claude Code和Google的Gemini Code Assist更专注于实时IDE协作，而Cursor AI则强调可解释性而不是自动化。OpenAI最近以30亿美元收购Windsurf，这凸显了其扩大Codex能力和市场领导地位的意图。

QKS集团副总监Nikhilesh Naik说：“Codex改变了工程团队处理日常任务的方式。”“企业将需要更少的入门级编码员和更多的系统思考者——那些能够大规模设计、编排和集成软件的人。”

整合法典

Codex将能够同时处理多个编码任务——构建功能、调试、编写测试——所有这些都通过ChatGPT的侧边栏。

根据新闻稿，开发人员将能够通过提示分配任务或提问，Codex遵循AGENTS.md文件中的项目规则，并从GitHub存储库中提取，以与团队实践保持一致。例如，它可以创建登录功能或解释复杂的代码——生成代码并显示日志和测试结果以供审查。

这种自动化水平标志着开发人员角色的转变。Naik说，企业不仅需要将开发人员视为代码作者，还需要将开发人员视为“认知架构师”，负责设计未来的维护者和审计师可以轻松理解的系统。

然而，Naik警告说，成功的集成取决于拥有结构化的代码库、定义的测试和范围明确的任务。如果没有这个，团队可能会花更多的时间清理而不是节省。Naik说：“现在将其用于端到端工作流程通常会导致结果不一致和回归。”

小心“静音功能”

Naik警告说，更大的担忧在于所谓的“无声故障”——人工智能生成的代码看起来正确，但破坏了模块化、掩盖了错误或引入了微妙的错误。他强调，需要明确的架构界限，精心设计的快速流程，以及在每项任务前后的严格验证流程，以避免将速度误认为是可靠性。

OpenAI表示，其工程师使用Codex执行起草文档等常规任务。像超人这样的早期采用者使非编码者能够调整代码，尽管人工审查仍然是必不可少的。根据公司的说法，最新的Codex CLI将为本地快速编辑和查询提供更快的Codex-mini-最新模型，通过API定价为每百万个输入令牌1.50美元，每百万个输出代币600美元。

这对企业意味着什么

Naik说：“OpenAI Codex的兴起预示着企业定义生产力、人才和架构价值的方式发生了转变。”

OpenAI表示，Kodiak.ai等公司将其用于调试工具，而Temporal将其应用于检修大型代码库。Codex的隔离环境阻止互联网访问并拒绝恶意代码，满足企业安全需求，尽管这可能会限制需要外部数据的任务。

尽管如此，对于首席信息官和首席技术官来说，挑战不仅仅是整合Codex，而是确保团队保留深刻的工程洞察力。Naik警告说，过度依赖此类工具可能会助长虚假的专业知识。他说：“没有持续的反馈循环——反向提示分析、架构审查和人工循环调试——Codex有可能成为一个不受控制的执行者，而不是学习支架。”

开发者的新时代？

人工智能正在迅速重塑软件的构建方式。GitHub首席执行官Thomas Dohmke预测，人工智能将很快编写80%的新代码。谷歌在2024年第三季度的财报电话会议上报告说，其超过四分之一的新代码是人工智能生成的。根据马克·扎克伯格的说法，Meta正在扩大其工程团队的人工智能采用。同样，许多Y Combinator初创公司大量利用大型语言模型。现在，OpenAI的Codex已经采用专注于规模、速度和安全性的企业优先方法。

但它并非没有风险。微软的一项研究发现，即使是顶级模型在调试上也会动摇，有时会引入漏洞。虽然法典承诺更快的周期和更好的测试，但仔细的监督——奈克所谓的“护栏”——仍然至关重要。

Codex将开发人员的角色从仅仅编写代码转变为指导智能系统、委派任务和审查结果。这提升了，而不是削弱了人类的判断力。Naik说：“风险不在开发人员停止编码，而是他们不再理解代码的作用。”

Naik认为，对于IT领导者来说，平衡这些强大的工具与保持敏锐的开发人员解决问题的技能的需要，因为人工智能处理基础编码，这是一个关键挑战。如果不严格审查产出，技术债务的威胁也迫在眉睫——OpenAI自己标记了这一点，敦促对所有Codex生成的代码进行手动验证。

归根结底，这不是人工智能能以多快的速度生出代码——而是我们如何深思熟虑地处理它给我们的东西。正如Naik所说，“像Codex这样的工具应该激发我们最好的工程本能和判断力，而不是取代它们。”

来源：AI中国一点号

标签：代理 openai 编码 codex codexai

本文地址：http://news.43b.com.cn/a/207375.html

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!