
OpenAI 于周一宣布,將為其 AI 編程工具 Codex 推出新版 GPT-5。該公司表示,這款名為 “GPT-5-Codex” 的新模型,其 “思考” 時間的分配比前代模型更具動態性,完成一項編程任務的耗時可從幾秒到 7 小時不等。這一特性使其在智能體編程基準測試(agentic coding benchmarks)中的表現更為出色。
目前,GPT-5-Codex 已開始在 Codex 系列產品中逐步推出。用戶可通過終端、集成開發環境(IDE)、GitHub 或 ChatGPT 訪問該工具,且所有 ChatGPT Plus、Pro、Business、Edu 及企業版(Enterprise)用戶均可使用。OpenAI 稱,未來計劃向 API 客戶開放該模型的使用權限。
此次更新是 OpenAI 提升 Codex 競爭力的舉措之一,旨在與 Claude Code、Anysphere 旗下的 Cursor、微軟 GitHub Copilot 等其他 AI 編程產品展開競爭。過去一年,受用戶需求激增推動,AI 編程工具市場的競爭已愈發激烈:2025 年初,Cursor 的年度經常性收入(ARR)突破 5 億美元;而另一款類似代碼編輯器 Windsurf 則成為多方競購的焦點,其團隊最終分裂并分別加入谷歌(Google)與 Cognition 公司,整個收購過程混亂無序。
OpenAI 表示,在兩項關鍵測試中,GPT-5-Codex 的表現均優于普通 GPT-5:一是衡量智能體編程能力的基準測試 SWE-bench Verified,二是針對大型成熟代碼庫中代碼重構任務的性能測試。

該公司還透露,GPT-5-Codex 經過了代碼審查任務的專項訓練,且 OpenAI 已邀請資深軟件工程師對該模型的審查意見進行評估。據悉,工程師們發現,GPT-5-Codex 給出的錯誤意見更少,同時能提供更多 “高影響力意見”(指對代碼質量、安全性或效率有顯著改善作用的建議)。
在一場簡報會上,OpenAI 的 Codex 產品負責人亞歷山大・恩比里科斯(Alexander Embiricos)表示,GPT-5-Codex 性能的提升,很大程度上得益于其動態 “思考能力”。用戶可能對 ChatGPT 中 GPT-5 的 “路由機制” 較為熟悉 —— 該機制會根據任務復雜度,將查詢分配給不同模型處理。恩比里科斯指出,GPT-5-Codex 的工作原理與此類似,但內部并無路由機制,而是能實時調整處理某項任務的時長。
恩比里科斯稱,這一特性相較于路由機制是一大優勢:路由機制在任務初始階段就會確定處理問題所需的計算資源與時間,而 GPT-5-Codex 則可在處理任務 5 分鐘后,自主判斷是否需要再投入 1 小時繼續完成。他表示,在部分案例中,該模型處理一項任務的耗時甚至超過了 7 小時。