大数据文摘受权转载自头部科技文丨丁灵波今天,OpenAI推出了该公司迄今为止功能最强的AI编码代理:Codex研究预览版。这是一款基于云的软件工程代理,可以并行处理多项任务,例如编写功能、解答代码库相关问题、修复错误以及提交拉取请求以供审核等,每个任务都在其专属的云沙盒环境中运行,并能预加载代码库。摘要:大数据文摘受权转载自头部科技文丨丁灵波今天,OpenAI推出了该公司迄今为止功能最强的AI编码代理:Codex研究预览版。这是一款基于云的软件工程代理,可以并行处理多项任务,例如编写功能、解答代码库相关问题、修复错误以及提交拉取请求以供审核等,每个任务都在其专
Codex可以通过放置在代码库中的AGENTS.md文件进行引导,开发者可以在其中告知Codex如何导航代码库、运行哪些命令进行测试以及如何最好地遵循项目的标准实践,与人类开发人员一样,Codex代理在配置好开发环境、可靠的测试设置和清晰的文档后,性能最佳。
在编码评估和内部基准测试中,codex-1表现出强劲性能。
OpenAI表示,训练codex-1的主要目标是使输出与人类的编码偏好和标准紧密结合,与OpenAI o3模型相比,codex-1始终能够生成更清晰的补丁,可供立即进行人工审核并集成到标准工作流程中。为了平衡安全性和实用性,Codex经过了训练,能够识别并精准拒绝旨在开发恶意软件的请求,同时清晰区分并支持合法任务。
此外,Codex代理完全在云端安全隔离的容器中运行,在任务执行期间,互联网访问被禁用,代理的交互仅限于通过GitHub代码库明确提供的代码以及用户通过安装脚本配置的预安装依赖项,代理无法访问外部网站、API或其他服务。
最后,OpenAI宣称其技术团队已开始将Codex纳入其日常工具包,OpenAI 工程师最常使用它来替代那些重复且范围明确的任务,例如重构、重命名和编写测试,它同样适用于构建新功能、连接组件、修复错误以及起草文档。
03 OpenAI的AI编码展望对于AI编码布局,OpenAI表示最新版的Codex仅仅是个开始。
未来,开发者可以自主掌控想要完成的重点工作,其余工作则能全面委托给代理——借助AI,开发速度会更快,效率更高,为了实现这一目标,OpenAI正在构建一整套Codex相关工具,支持实时协作和异步委托。
最终,实时配对和任务委托将逐渐融合,开发者将通过IDE和日常工具与AI代理协作,提出问题、获取建议并卸载耗时较长的任务,所有这些都在统一的工作流程中进行。
OpenAI还在推进与开发者现有的工具进行更深入的集成:目前Codex已与GitHub连接,不久后开发者将能够从Codex CLI、ChatGPT桌面应用,甚至是问题跟踪器或CI系统等工具中分配任务。
根据SimilarWeb的市场分析数据,过去12周内,以开发人员为中心的AI工具的流量激增了75%,凸显了行业对编码助手作为基本基础设施而非实验性附加组件的需求日益增长。
OpenAI曾与快速发展的AI开发工具初创公司Cursor和Windsurf进行收购谈判,据称,Cursor拒绝了收购,Windsurf原则上同意OpenAI以30亿美元价格收购,但这笔收购目前尚没有尘埃落定,就在昨天,Windsurf还推出了其专注于编码的基础模型SWE-1强化市场竞争。
新的Codex代理推出,外界分析认为是OpenAI向Windsurf、Cursor等施压的一种方式,增加谈判筹码进而达成更有性价比的交易或收购,同时与谷歌、Anthropic等在AI编码代理领域展开正面对抗,重塑市场竞争格局。
来源:大数据文摘