先做个广告:如需代注册ChatGPT或充值 GPT5会员(plus),请添加站长微信:gptchongzhi
编程新王者真的要来了!
推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top
刚刚,OpenAI 发布了 GPT-5-Codex:一个专门为 Agent 编程优化的全新模型。
并且,该模型同步在 Codex CLI、IDE 扩展、网页端、移动端以及 GitHub 代码审查中全面可用。
动态思考
GPT-5-Codex 最具革命性的特性是沿用了 GPT-5 的动态调整思考时间。
它会根据任务复杂度自动决定投入多少计算资源:简单任务秒回,复杂任务深度思考。
在 OpenAI 员工的实际使用数据中,处理最简单的 10% 任务时,GPT-5-Codex 比 GPT-5 减少了 93.7% 的 token 使用量。
而面对最复杂的 10% 任务,它会花费两倍时间进行推理、编辑、测试和迭代。
测试中,GPT-5-Codex 曾独立工作超过 7 小时处理大型复杂任务,不断迭代实现、修复测试失败,最终交付成功的实现。
这种能力让 Codex 在交互式编程会话中反应迅速,同时又能独立完成需要长时间思考的复杂任务。
性能全面碾压
基准测试成绩:
在 SWE-bench Verified (500 个任务)上,GPT-5-Codex 达到 74.5% 的准确率,超过 GPT-5 的 72.8%。
在代码重构任务上表现更是亮眼:GPT-5-Codex 准确率达到 51.3%,大幅领先 GPT-5 的 33.9%。这个评估包含了来自大型成熟代码库的重构任务,涵盖 Python、Go 甚至 OCaml。
其中一个示例任务来自 Gitea,需要修改 232 个文件和 3,541 行代码。
代码审查能力突破:
GPT-5-Codex 被专门训练用于代码审查和发现关键缺陷。它会导航代码库、推理依赖关系、运行代码和测试来验证正确性。
在评估中:
错误评论率仅 4.4%(GPT-5:13.7%)
高影响力评论占比 52.4%(GPT-5:39.4%)
平均每个 PR 0.93 条评论(GPT-5:1.32 条)
GPT-5-Codex 在前端任务上也表现出色。
除了创建美观的桌面应用,在创建移动网站时的人类偏好评估中也显示出显著改进。在云端工作时,它可以查看你提供的图片或截图输入,视觉检查进度,并向你展示工作截图。
Codex 平台大升级
Codex CLI 0.36 重大更新:
新版本完全重建了 CLI 架构,专门针对 Agent 编程工作流优化。主要特性包括:
图片支持:可以直接在 CLI 中附加和分享截图、线框图、设计图
进度追踪:复杂工作时用待办事项列表追踪进度
工具集成:包含网页搜索和 MCP(Model Context Protocol)连接外部系统
UI 升级:工具调用和 diff 格式更清晰易读
简化审批模式:三个级别——只读模式(需要显式批准)、自动模式(工作区内完全访问但工作区外需要批准)、完全访问模式
会话管理:支持压缩会话状态,让长时间会话更易管理
恢复功能:可以通过
codex resume
恢复旧会话
IDE 扩展全新体验:
新的 IDE 扩展将 Codex Agent 带入 VS Code、Cursor 和其他 VS Code 分支。
它能利用你打开的文件或选中的代码作为上下文,让你写更短的提示词,获得更快的结果。
更重要的是,IDE 扩展实现了云端和本地的无缝切换:
你可以在 IDE 中创建云任务、追踪进行中的工作、审查已完成的任务,而 Codex 会保持完整上下文。
云端基础设施优化:
通过容器缓存,新任务和后续任务的中位完成时间缩短了 90%。
Codex 现在会自动扫描常见的设置脚本并执行它们来配置环境,还可以通过可配置的互联网访问运行 pip install
等命令来获取依赖。
GitHub 集成更新
一旦为 GitHub 仓库启用,Codex 会在 PR 从草稿转为就绪时自动进行审查,并将分析结果发布在 PR 上。
如果它建议编辑,你可以在同一个线程中要求 Codex 实施这些更改。
你也可以通过提及「@codex review」来明确请求审查,还可以给出额外指导,如「@codex review for security vulnerabilities」或「@codex review for outdated dependencies」。
在 OpenAI 内部,Codex 现在审查绝大多数 PR,每天捕获数百个问题——
通常在人类审查开始之前。
安全与隐私
GPT-5-Codex 默认在沙盒环境中运行,禁用网络访问,无论是本地还是云端。这确保 Codex 不会在你的计算机上执行有害操作,并降低来自不可信源的提示注入风险。
开发者可以根据风险承受能力自定义安全设置。
在云端,可以将网络访问限制在可信域名。在 CLI 和 IDE 扩展中,开发者可以批准命令以完全访问权限运行,或允许 Agent 使用网页搜索和连接 MCP 服务器。
与 GPT-5 的处理方式一致,OpenAI 将 GPT-5-Codex 在生物和化学领域视为高能力模型,并实施了相应的保护措施。
定价与可用性
Codex 包含在 ChatGPT Plus、Pro、Business、Edu 和 Enterprise 计划中:
Plus、Edu、Business:可支持每周几次集中的编程会话
Pro:可支持跨多个项目的完整工作周
Business:可购买额外积分超出限制使用
Enterprise:提供共享积分池,按实际使用付费
对于通过 API key 使用 Codex CLI 的开发者,OpenAI 计划很快在 API 中提供 GPT-5-Codex。
Dan Shipper(@danshipper) 表示已经用了一周,并给出了两个重要趋势:
动态思考时间:他们将这个模式从 ChatGPT 移植到了编程模型,这将成为未来的标准。
本地到网页的交接:你的 Agent 应该在任何地方都能带着完整上下文陪伴你。
面对 Claude Code 最近频繁出现的「降智」之谜,越来越多开发者开始考虑迁移。
众多开发者询问能否提供 100 美元的计划,让从 Claude Code 切换过来的成本不那么痛苦?
作为 AGI 最核心的一环,编程正成为各模型厂商新的战场——
我先前一直是 20
是时候将 200$ 从 Claude Code 转向 Codex 了!
OpenAI Codex 介绍页面: https://openai.com/index/introducing-upgrades-to-codex/
[2]Codex CLI GitHub: https://github.com/openai/codex
[3]Codex IDE 快速入门: https://developers.openai.com/codex/ide
[4]Codex 云端文档: https://developers.openai.com/codex/cloud
[5]代码审查快速入门: https://developers.openai.com/codex/cloud/code-review
[6]GPT-5 系统卡片附录: https://openai.com/index/gpt-5-system-card-addendum-gpt-5-codex/
[7]Codex 定价说明: https://developers.openai.com/codex/pricing
[8]Codex 安全操作指南: https://developers.openai.com/codex/security
[9]Agent 网络访问文档: https://platform.openai.com/docs/codex/agent-network
网友评论