OpenAI发布代码Agent:开启自动化编程时代,超强智能体
6 小时前 / 阅读约6分钟
来源:凤凰网

OpenAI在官网发布了一个全新基于云端的代码Agent——Codex。

Codex可以为开发人员自动执行多种任务,例如,编写功能代码、回答有关代码库的问题、修复错误以及提出拉取请求审查等;每个任务都在自己的云端沙盒环境中运行,同时能预加载用户的代码库。

据悉,Codex由Codex-1模型提供支持,这是OpenAI-o3的一个微调版本,专门针对软件工程进行了优化。通过强化学习在多种环境中对真实世界的编码任务进行训练,生成的代码能够贴合程序员的代码风格和拉取请求偏好,并严格遵循指令。

Codex工作原理

目前,OpenAI已经向ChatGPTPro、Enterprise和Team用户开放了Codex功能。可以通过ChatGPT的侧边栏访问Codex,并通过输入提示词并点击“Code”来为其分配新的编码任务。如果你想向Codex询问有关代码库的问题,点击“Ask”即可。

每个任务都在一个独立的隔离环境中独立处理,并预加载了用户的代码库。Codex可以读取和编辑文件,以及运行包括测试框架、代码检查工具和类型检查器在内的命令。

通常完成任务需要1—30分钟,具体取决于任务的复杂性,并可以实时监控Codex的工作进度。

一旦Codex完成任务,会在其环境中提交更改。Codex通过引用终端日志和测试输出来提供其操作的可验证证据,从而让用户能够追溯任务完成过程中的每一步。

然后,可以让用户审查结果,请求进一步修订,打开GitHub拉取请求,或将更改直接集成到本地开发环境中。

用户也可以在代码库中放置AGENTS.md文件来指导Codex。这是一种类似于README.md的文本文件,可以告诉Codex如何导航你的代码库、运行哪些命令进行测试,以及如何最好地遵循你的项目的标准实践等。就像和人类程序员交谈一样,告诉他你想执行的一切就行。

根据OpenAI公布的测试数据显示,在没有AGENTS.md文件或自定义脚手架的情况下,codex-1在编码评估和内部基准测试中表现出色,其能力已经超过了OpenAI最强模型之一o3-high。

符合人类偏好

在训练codex-1时,OpenAI的主要目标是使其输出尽可能符合人类编码偏好和标准。与OpenAIo3相比,Codex-1始终能够生成更干净的补丁,这些补丁可以立即进行人类审查并集成到标准工作流程中。

随着AI驱动的软件工程的恶意应用变得越来越关键,同时确保保护措施不会不必要地阻碍涉及恶意软件开发技术的合法和有益应用也很重要。

为了平衡安全性和实用性,Codex被训练成能够识别并明确拒绝旨在开发恶意软件的请求,同时清晰地区分并支持合法任务。OpenAI还增强了政策框架并纳入了严格的安全评估,以有效加强这些边界。

Codex完全在云端的安全隔离容器中运行。在任务执行过程中,互联网访问被禁用,将智能体的交互限制为仅限于通过GitHub代码库明确提供的代码和用户通过设置脚本配置的预安装依赖项。智能体无法访问外部网站、API或其他服务。

Codex应用案例

目前,Codex已经成为OpenAI内部开发的高效率开发助手。OpenAI工程师最常使用Codex来执行重复、繁琐、范围明确的任务,例如,重构、重命名和编写测试等。也适用于搭建新功能、连接组件、修复错误和起草文档。

OpenAI正在围绕Codex建立新的开发习惯:处理日常编码问题、在一天开始时规划任务以及监控最新的开发任务等。通过减少上下文切换和提醒被遗忘的待办事项,Codex能帮助工程师更快地交付产品,并专注于最重要的事情。

此外,OpenAI还与一些知名企业进行合作,对Codex进行了实际开发场景化测试。

Temporal正使用Codex加速功能开发、调试问题、编写和执行测试以及重构大型代码库。还可以通过在后台运行复杂任务来帮助他们保持专注——让工程师保持流畅的工作状态,同时加快迭代速度。

Superhuman使用 Codex 加速小但重复的编程任务,例如,提高测试覆盖率和修复集成失败。还可以通过让产品经理在不使用工程师的情况下贡献轻量级代码更改,来帮助他们更快地交付产品。

Kodiak正在使用 Codex 帮助编写调试工具、提高测试覆盖率和重构代码——加速其 Kodiak Driver自动驾驶技术的开发。Codex还成为了一个有价值的参考工具,通过提供相关上下文和过去的更改,帮助工程师理解不熟悉的代码堆栈。

更新开源Codex CLI

OpenAI还对其开源的轻量级、终端代码智能体Codex CLI进行了更新,发布了Codex-1 的较小版本。

这是一个专门为 Codex CLI设计的 o4-mini 版本。这个新模型支持 CLI 中的快速工作流程,并针对低延迟代码问答和编辑进行了优化,同时保留了相同的指令遵循和风格优势。

现在作为 Codex CLI 中的默认模型提供,并在API中作为codex-mini-latest 提供。底层快照将随着不断改进 Codex-mini 模型而定期更新。

还能将开发人员账户连接到 Codex CLI 变得更加容易。用户无需手动生成和配置 API token,现在可以使用你的 ChatGPT 账户登录,并选择你想要使用的 API 组织。OpenAI将为你自动生成和配置 API 密钥。

本文素材来源OpenAI,如有侵权请联系删除