1小时前OpenAI再次放大招:推出名为Codex的云端软件工程智能体,由强大的codex-1模型驱动
Codex功能被描述为:Answers questions, runs code, and drafts PRs
简单来说,Codex可以代码、测试、PR一站式搞定,它可以帮你:
• 编写新功能
• 实时解答代码库的各种疑问
• 修复Bug
• 提出PR(Pull Request)
每一项任务都在独立的云沙盒环境中运行,并且会预装好你的代码库。目前,ChatGPT Pro、Team和Enterprise用户今天就能尝鲜,Plus和Edu用户也快了!
网友已经在骂奥特曼了,plus用户竟然没有优先体验权
Codex的核心引擎与特点
Codex的“心脏”是codex-1,这是OpenAI o3针对软件工程优化的专属版本。它牛在哪?
1. 真实世界锤炼:通过强化学习在海量真实世界的编码任务中训练
2. “人味”十足:生成的代码风格和PR偏好都高度拟人化,力求与你的团队无缝对接
3. 精准执行:严格遵循指令
4. 迭代测试:能自己跑测试,不通过不罢休,直到拿到“绿灯”。
Codex如何使用?
操作直观:
入口:ChatGPT侧边栏
图source:@testingcatlog
下指令:输入你的需求,想让它干活就点“Code”,想问问题就点“Ask”
独立环境:每个任务都在隔离环境中处理,Codex能读写文件、跑测试、用linter和类型检查器等
实时进度:任务耗时1到30分钟不等(看复杂度),进度条让你心里有数
任务完成后,Codex会提交更改,并提供终端日志、测试输出等可验证的行动证据,方便你追溯每一步。你可以审查结果、要求修改、直接开PR,或者把代码集成到本地。甚至,你还能配置Codex环境,让它无限接近你的真实开发环境
OpenAI的建议:
并行分配多个明确范围的任务给不同的Codex Agent,并多尝试不同类型的任务和提示,来摸索它的能力边界
人工审查仍是王道:所有AI生成的代码,在集成和执行前,强烈建议人工审查和验证,用户可验证,通过引用、终端日志和测试结果来检查Codex的工作,遇到不确定或测试失败时,Codex会明确告诉你,帮你做决策
Codex在安全的隔离云容器中运行。任务执行期间,互联网访问是禁用的。它只能接触到通过GitHub仓库明确提供的代码,以及用户通过设置脚本配置的预装依赖。想访问外部网站、API或其他服务?没门
智能引导:AGENTS.md文件
Codex还能通过你仓库中的AGENTS.md
文件(类似README.md)进行“调教”。这些文件可以告诉Codex:
• 如何导航你的代码库
• 运行哪些测试命令
• 项目有哪些标准规范
就像咱们人类开发者一样,一个配置完善的开发环境、可靠的测试和清晰的文档,能让Codex发挥出120%的功力
性能如何?数据说话!
在SWE-Bench Verified和OpenAI内部SWE任务基准测试中,codex-1表现抢眼,即使没有AGENTS.md
文件也优于o3-high模型。它能产出比OpenAI o3更整洁、可直接供人工审查和集成的代码补丁
早期用户怎么说?
OpenAI内部:工程师们已经用Codex处理日常的重构、重命名、写测试等重复性任务,还用它搭建新功能、修Bug、起草文档。它甚至能帮忙分流on-call问题、规划日初任务、处理后台工作,大大减少了工程师的上下文切换
外部测试伙伴:
* Cisco:用Codex加速将雄心勃勃的想法变为现实,并共同塑造Codex的未来。
* Temporal:加速功能开发、调试、测试执行和大型代码库重构,让工程师更专注。
* Superhuman:提升测试覆盖率、修复集成故障,甚至让产品经理也能贡献轻量级代码(只需工程师Code Review)
* Kodiak(自动驾驶):编写调试工具、提升测试覆盖、重构代码,加速其自动驾驶技术的研发。
Codex CLI也迎来升级,更快更便捷!
还记得上个月OpenAI发布的轻量级终端编码助手Codex CLI吗?它主要用o3和o4-mini模型
今天,OpenAI为其推出了一个更小的codex-1版本(可理解为o4-mini的特化版),专为CLI优化:
更快工作流:CLI体验更丝滑。
低延迟:代码问答和编辑响应迅速。
保持强项:指令遵循和代码风格依然优秀。
默认选择:已成为Codex CLI和API中codex-mini-latest
的默认模型
连接开发者账户到Codex CLI也更简单了:
ChatGPT账户登录:选择你的API组织。
自动配置API密钥。
福利:Plus和Pro用户通过ChatGPT登录Codex CLI,分别能获得5美元和50美元的免费API额度(有效期30天,今天晚些时候生效)
Codex 定价与局限
Codex本体:今天起向全球ChatGPT Pro、Enterprise和Team用户推出。Plus和Edu用户支持稍后就来。初期会有免费访问额度,之后会转为限速访问和按需付费选项
codex-mini-latest
API定价:每百万输入token 1.5美元,输出token 6美元,还有给力的75%提示缓存折扣
写在最后
Codex当前局限性,
暂缺功能:如前端工作所需的图像输入、任务中途的人工干预修正
远程代理任务耗时比本地交互式编辑长,需要点时间适应。
OpenAI设想的未来是:开发者主导核心工作,将其他任务委托给AI智能体,从而更快、更高效。他们正构建一套支持实时协作与异步委托的Codex工具:
• 实时配对(如Codex CLI)已成常态,异步、多智能体工作流是下一站
• 两种交互模式将融合:开发者将在IDE和日常工具中与AI智能体协作——提问、获取建议、分派较长任务,形成统一工作流
• 更深度集成:Codex将与GitHub、Codex CLI、ChatGPT桌面端,乃至你的问题跟踪器和CI/CD系统深度整合
OpenAI正与合作伙伴共同探索AI智能体广泛应用对开发者工作流、技能发展及地域差异的深远影响
这,仅仅是个开始