Codex 实测：OpenAI 的云端 Coding Agent

摘要：昨晚，OpenAI 上了个新功能：Codex，云端的 Coding Agent

昨晚，OpenAI 上了个新功能：
Codex，云端的 Coding Agent

Codex 简要概述
这东西，由 3 部分组成：
codex-1 模型、云端沙盒、GitHub 接口封装

不错的产品，交互很赞
但不能自主装依赖，目前干不了活

这个 Agent 的功能大概包含：

• 问答 Git 上的项目• 跑现成的代码• 修代码，提 PR（修改代码，然后提交上去）

按 OpenAI 员工的说法，他们部分时候也会拿这个处理代码

总评：非常没用

• ❌ 不能联网（不能访问外部 API、网站）• ❌ 不能临时装依赖（如 pip install 无效）• ✅ 只能用你仓库里已有的代码 + 你事先配置好的环境

所以这东西，只能做缝补，几乎干不了重活

我能想到的几个典型场景：

• QA 大佬们的代码• 写一点不需要配环境的代码

DeepEP 是之前 DeepSeek 开源的 Infra 框架，我先把它丢进去，选择「询问」就好了

我本职专业，是EE。

Verlog 这东西，和常规环境没啥关系，但非常依赖 AI 对整体项目的理解，而且完全不能依赖 Rag 代码。

效果是不错的，改改能用（毕竟 o3）。

说真的，这东西的实现并不复杂，相信很快就会有一堆类似的。

分为三块：模型、云端沙盒、打通 GitHub，分别来说说

Codex 背后的模型是 codex-1，通过 o3 调出来的，让风格更贴近「人写的代码」，并且准确性也提升了一些。

以及，发了一个同源的模型：codex-mini-latest，输入 $1.5，输出 $6 每百万 token，比 o4-mini 贵了 30%左右。

在代码场景下，效果比 o3 更好一点

调的方法，叫做 Reinforcement Learning，强化微调，之前介绍过：
OpenAI 新货详解：强化微调

云端沙盒

Codex 的代码是跑在云端的，会为每个任务启动一个独立的云端沙盒环境，这环境里：

• 预先拉好你选的 GitHub 仓库（只读）• 跑你配置好的构建脚本、测试命令、lint 等• 不联网，也没办法 pip install

大致就是“开了一台干净的服务器”，只装你确认过的东西，它再在里面开始「干活」。

注意：所有修改都只在这个沙盒里完成，Codex 不能直接动你线上仓库的代码，最终得你点按钮发 PR 或下载补丁。

Codex 需要你授权 GitHub：

• 你点「Connect GitHub」之后，它会拿到你的仓库只读权限（或者写权限，如果你开了）• 如果你是团队账户，还要选组织、设定权限范围• 需要启用 MFA（多因素认证），毕竟你让 AI 有权限提 PR，可以用 Google Auth 或者任何，这里我用的 OnePass

可以吹，别过分

老实讲...
这些任务，不用 Codex 也能完成

这个东西全名叫 Codex Research Preview，单纯 Preview 已经不够了，还得加上 Research，毕竟啥活也干不了，不要有太高的期待

但是，方向是很赞的。

假想一下
你干活干到一半去吃法了，AI 无缝接管了你的环境，继续完成你的工作

来源：时空探险家

标签： agent coding codex codingagent

免责声明：本站系转载，并不代表本网赞同其观点和对其真实性负责。如涉及作品内容、版权和其它问题，请在30日内与本站联系，我们将在第一时间删除内容!