摘要:据该公司称,Codex由codex-1提供支持,codex-1是OpenAI为软件开发优化的o3模型的变体,并在与GitHub集成的基于云的隔离环境中运行。
OpenAI最先进的人工智能编码代理Codex将为开发人员带来并行任务自动化——但分析师警告说,未经审查的速度会带来“无声的失败”。
OpenAI宣布发布Codex,这是一个人工智能编码代理,它表示旨在帮助软件工程师编写代码、修复错误和运行测试。
据该公司称,Codex由codex-1提供支持,codex-1是OpenAI为软件开发优化的o3模型的变体,并在与GitHub集成的基于云的隔离环境中运行。
最初向ChatGPT Pro、Enterprise和Team用户推出,OpenAI表示,它计划很快将访问权限扩展到Plus和Edu用户。
思科和Temporal等公司开始测试Codex进行调试和功能开发。然而,与实时编码助手相比,其任务持续时间(从1分钟到30分钟不等)和预期使用限制提出了关于工作流程效率和成本效益的问题。
与提供内联建议的GitHub Copilot不同,OpenAI的新代理可以自动执行多步骤任务。Anthropic的Claude Code和Google的Gemini Code Assist更专注于实时IDE协作,而Cursor AI则强调可解释性而不是自动化。OpenAI最近以30亿美元收购Windsurf,这凸显了其扩大Codex能力和市场领导地位的意图。
QKS集团副总监Nikhilesh Naik说:“Codex改变了工程团队处理日常任务的方式。”“企业将需要更少的入门级编码员和更多的系统思考者——那些能够大规模设计、编排和集成软件的人。”
整合法典
Codex将能够同时处理多个编码任务——构建功能、调试、编写测试——所有这些都通过ChatGPT的侧边栏。
根据新闻稿,开发人员将能够通过提示分配任务或提问,Codex遵循AGENTS.md文件中的项目规则,并从GitHub存储库中提取,以与团队实践保持一致。例如,它可以创建登录功能或解释复杂的代码——生成代码并显示日志和测试结果以供审查。
这种自动化水平标志着开发人员角色的转变。Naik说,企业不仅需要将开发人员视为代码作者,还需要将开发人员视为“认知架构师”,负责设计未来的维护者和审计师可以轻松理解的系统。
然而,Naik警告说,成功的集成取决于拥有结构化的代码库、定义的测试和范围明确的任务。如果没有这个,团队可能会花更多的时间清理而不是节省。Naik说:“现在将其用于端到端工作流程通常会导致结果不一致和回归。”
小心“静音功能”
Naik警告说,更大的担忧在于所谓的“无声故障”——人工智能生成的代码看起来正确,但破坏了模块化、掩盖了错误或引入了微妙的错误。他强调,需要明确的架构界限,精心设计的快速流程,以及在每项任务前后的严格验证流程,以避免将速度误认为是可靠性。
OpenAI表示,其工程师使用Codex执行起草文档等常规任务。像超人这样的早期采用者使非编码者能够调整代码,尽管人工审查仍然是必不可少的。根据公司的说法,最新的Codex CLI将为本地快速编辑和查询提供更快的Codex-mini-最新模型,通过API定价为每百万个输入令牌1.50美元,每百万个输出代币600美元。
这对企业意味着什么
Naik说:“OpenAI Codex的兴起预示着企业定义生产力、人才和架构价值的方式发生了转变。”
OpenAI表示,Kodiak.ai等公司将其用于调试工具,而Temporal将其应用于检修大型代码库。Codex的隔离环境阻止互联网访问并拒绝恶意代码,满足企业安全需求,尽管这可能会限制需要外部数据的任务。
尽管如此,对于首席信息官和首席技术官来说,挑战不仅仅是整合Codex,而是确保团队保留深刻的工程洞察力。Naik警告说,过度依赖此类工具可能会助长虚假的专业知识。他说:“没有持续的反馈循环——反向提示分析、架构审查和人工循环调试——Codex有可能成为一个不受控制的执行者,而不是学习支架。”
开发者的新时代?
人工智能正在迅速重塑软件的构建方式。GitHub首席执行官Thomas Dohmke预测,人工智能将很快编写80%的新代码。谷歌在2024年第三季度的财报电话会议上报告说,其超过四分之一的新代码是人工智能生成的。根据马克·扎克伯格的说法,Meta正在扩大其工程团队的人工智能采用。同样,许多Y Combinator初创公司大量利用大型语言模型。现在,OpenAI的Codex已经采用专注于规模、速度和安全性的企业优先方法。
但它并非没有风险。微软的一项研究发现,即使是顶级模型在调试上也会动摇,有时会引入漏洞。虽然法典承诺更快的周期和更好的测试,但仔细的监督——奈克所谓的“护栏”——仍然至关重要。
Codex将开发人员的角色从仅仅编写代码转变为指导智能系统、委派任务和审查结果。这提升了,而不是削弱了人类的判断力。Naik说:“风险不在开发人员停止编码,而是他们不再理解代码的作用。”
Naik认为,对于IT领导者来说,平衡这些强大的工具与保持敏锐的开发人员解决问题的技能的需要,因为人工智能处理基础编码,这是一个关键挑战。如果不严格审查产出,技术债务的威胁也迫在眉睫——OpenAI自己标记了这一点,敦促对所有Codex生成的代码进行手动验证。
归根结底,这不是人工智能能以多快的速度生出代码——而是我们如何深思熟虑地处理它给我们的东西。正如Naik所说,“像Codex这样的工具应该激发我们最好的工程本能和判断力,而不是取代它们。”
来源:AI中国一点号