刚刚,OpenAI 发布 GPT‑5-Codex 新模型,专为编程而生

ChatGPT人工智能2025-09-16 10:32:585

先做个广告:如需代注册ChatGPT或充值 GPT5会员(plus),请添加站长微信:gptchongzhi

编程新王者真的要来了!

推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top 

刚刚,OpenAI 发布了 GPT-5-Codex:一个专门为 Agent 编程优化的全新模型。

并且,该模型同步在 Codex CLI、IDE 扩展、网页端、移动端以及 GitHub 代码审查中全面可用。

动态思考

GPT-5-Codex 最具革命性的特性是沿用了 GPT-5 的动态调整思考时间

它会根据任务复杂度自动决定投入多少计算资源:简单任务秒回,复杂任务深度思考。

在 OpenAI 员工的实际使用数据中,处理最简单的 10% 任务时,GPT-5-Codex 比 GPT-5 减少了 93.7% 的 token 使用量。

而面对最复杂的 10% 任务,它会花费两倍时间进行推理、编辑、测试和迭代。

测试中,GPT-5-Codex 曾独立工作超过 7 小时处理大型复杂任务,不断迭代实现、修复测试失败,最终交付成功的实现。

这种能力让 Codex 在交互式编程会话中反应迅速,同时又能独立完成需要长时间思考的复杂任务。

性能全面碾压

基准测试成绩:

在 SWE-bench Verified (500 个任务)上,GPT-5-Codex 达到 74.5% 的准确率,超过 GPT-5 的 72.8%。

代码重构任务上表现更是亮眼:GPT-5-Codex 准确率达到 51.3%,大幅领先 GPT-5 的 33.9%。这个评估包含了来自大型成熟代码库的重构任务,涵盖 Python、Go 甚至 OCaml。

其中一个示例任务来自 Gitea,需要修改 232 个文件和 3,541 行代码。

代码审查能力突破:

GPT-5-Codex 被专门训练用于代码审查和发现关键缺陷。它会导航代码库、推理依赖关系、运行代码和测试来验证正确性。

在评估中:

  • 错误评论率仅 4.4%(GPT-5:13.7%)

  • 高影响力评论占比 52.4%(GPT-5:39.4%)

  • 平均每个 PR 0.93 条评论(GPT-5:1.32 条)

GPT-5-Codex 在前端任务上也表现出色。

除了创建美观的桌面应用,在创建移动网站时的人类偏好评估中也显示出显著改进。在云端工作时,它可以查看你提供的图片或截图输入,视觉检查进度,并向你展示工作截图。

Codex 平台大升级

Codex CLI 0.36 重大更新:

新版本完全重建了 CLI 架构,专门针对 Agent 编程工作流优化。主要特性包括:

  • 图片支持:可以直接在 CLI 中附加和分享截图、线框图、设计图

  • 进度追踪:复杂工作时用待办事项列表追踪进度

  • 工具集成:包含网页搜索和 MCP(Model Context Protocol)连接外部系统

  • UI 升级:工具调用和 diff 格式更清晰易读

  • 简化审批模式:三个级别——只读模式(需要显式批准)、自动模式(工作区内完全访问但工作区外需要批准)、完全访问模式

  • 会话管理:支持压缩会话状态,让长时间会话更易管理

  • 恢复功能:可以通过 codex resume 恢复旧会话

IDE 扩展全新体验:

新的 IDE 扩展将 Codex Agent 带入 VS Code、Cursor 和其他 VS Code 分支。

它能利用你打开的文件或选中的代码作为上下文,让你写更短的提示词,获得更快的结果。

更重要的是,IDE 扩展实现了云端和本地的无缝切换

你可以在 IDE 中创建云任务、追踪进行中的工作、审查已完成的任务,而 Codex 会保持完整上下文。

云端基础设施优化:

通过容器缓存,新任务和后续任务的中位完成时间缩短了 90%

Codex 现在会自动扫描常见的设置脚本并执行它们来配置环境,还可以通过可配置的互联网访问运行 pip install 等命令来获取依赖。

GitHub 集成更新

一旦为 GitHub 仓库启用,Codex 会在 PR 从草稿转为就绪时自动进行审查,并将分析结果发布在 PR 上。

如果它建议编辑,你可以在同一个线程中要求 Codex 实施这些更改。

你也可以通过提及「@codex review」来明确请求审查,还可以给出额外指导,如「@codex review for security vulnerabilities」或「@codex review for outdated dependencies」。

在 OpenAI 内部,Codex 现在审查绝大多数 PR,每天捕获数百个问题——

通常在人类审查开始之前。

安全与隐私

GPT-5-Codex 默认在沙盒环境中运行,禁用网络访问,无论是本地还是云端。这确保 Codex 不会在你的计算机上执行有害操作,并降低来自不可信源的提示注入风险。

开发者可以根据风险承受能力自定义安全设置。

在云端,可以将网络访问限制在可信域名。在 CLI 和 IDE 扩展中,开发者可以批准命令以完全访问权限运行,或允许 Agent 使用网页搜索和连接 MCP 服务器。

与 GPT-5 的处理方式一致,OpenAI 将 GPT-5-Codex 在生物和化学领域视为高能力模型,并实施了相应的保护措施。

定价与可用性

Codex 包含在 ChatGPT Plus、Pro、Business、Edu 和 Enterprise 计划中:

  • Plus、Edu、Business:可支持每周几次集中的编程会话

  • Pro:可支持跨多个项目的完整工作周

  • Business:可购买额外积分超出限制使用

  • Enterprise:提供共享积分池,按实际使用付费

对于通过 API key 使用 Codex CLI 的开发者,OpenAI 计划很快在 API 中提供 GPT-5-Codex。

Dan Shipper(@danshipper) 表示已经用了一周,并给出了两个重要趋势:

动态思考时间:他们将这个模式从 ChatGPT 移植到了编程模型,这将成为未来的标准。

本地到网页的交接:你的 Agent 应该在任何地方都能带着完整上下文陪伴你。

面对 Claude Code 最近频繁出现的「降智」之谜,越来越多开发者开始考虑迁移。

众多开发者询问能否提供 100 美元的计划,让从 Claude Code 切换过来的成本不那么痛苦?

作为 AGI 最核心的一环,编程正成为各模型厂商新的战场——

我先前一直是 20 Claude Max,现在看来,或许——

是时候将 200$ 从 Claude Code 转向 Codex 了!




[1]

OpenAI Codex 介绍页面: https://openai.com/index/introducing-upgrades-to-codex/

[2]

Codex CLI GitHub: https://github.com/openai/codex

[3]

Codex IDE 快速入门: https://developers.openai.com/codex/ide

[4]

Codex 云端文档: https://developers.openai.com/codex/cloud

[5]

代码审查快速入门: https://developers.openai.com/codex/cloud/code-review

[6]

GPT-5 系统卡片附录: https://openai.com/index/gpt-5-system-card-addendum-gpt-5-codex/

[7]

Codex 定价说明: https://developers.openai.com/codex/pricing

[8]

Codex 安全操作指南: https://developers.openai.com/codex/security

[9]

Agent 网络访问文档: https://platform.openai.com/docs/codex/agent-network

chatgpt plus(GPT4)代充值

本文链接:https://www.shikelang.cc/post/3067.html

GPT‑5-Codex

更多ChatGPT相关文章

网友评论