核心摘要
- GPT-5.4 是新的預設模型:2026年3月5日發佈,它結合了 GPT-5.3 Codex 的程式設計實力與更廣泛的推理能力、1M-tokens 的上下文視窗,以及原生的電腦使用能力。
- 六款模型滿足不同需求:旗艦款 (5.4)、平衡款 (5.4 Mini)、快速款 (5.4 Nano)、程式設計專家 (5.3 Codex)、日常任務 (5.3 Instant) 以及舊版 (5.2 Thinking)。
- 價格跨度達 10 倍:從輸入每 $0.30/MTok (GPT-5.3 Instant) 到 $2.50/MTok (GPT-5.4) —— 選擇正確的模型將直接影響您的帳單。
- GPT-5.2 將於 June 5 退役:立即遷移 以避免服務中斷。
OpenAI GPT-5 模型家族完全指南
OpenAI 的 GPT-5 家族已發展出六款不同的模型,每款模型都針對能力、速度和成本之間的權衡進行了優化。選擇錯誤的模型意味著要麼為簡單任務支付過高費用,要麼在複雜任務中動力不足。
本指南涵蓋了每款模型,包含定價、基準測試和明確的決策框架。
全系列陣容 (March 2026)
| 模型 | 角色 | 輸入成本 | 輸出成本 | 上下文 | 發佈日期 |
|---|---|---|---|---|---|
| GPT-5.4 | 旗艦推理 + 程式設計 | $2.50/MTok | $10.00/MTok | 1.05M | Mar 5, 2026 |
| GPT-5.4 Mini | 快速平衡 | 較低 | 較低 | 較小 | Mar 2026 |
| GPT-5.4 Nano | 最低延遲 | 最低 | 最低 | 最小 | Mar 2026 |
| GPT-5.3 Codex | 程式設計專家 | $1.75/MTok | $7.00/MTok | 400K | Mar 3, 2026 |
| GPT-5.3 Instant | 日常任務 | ~$0.30/MTok | ~$1.20/MTok | 標準 | Mar 3, 2026 |
| GPT-5.2 Thinking | 舊版旗艦 | 較高 | 較高 | 較小 | 之前 |
資料來源:OpenAI API Models, FelloAI Comparison
GPT-5.4:全新旗艦模型
GPT-5.4 是 OpenAI 目前最強大的模型 —— 這是首個在單一架構中結合了尖端推理與尖端程式設計能力的模型。
核心特色
- 1,050,000-tokens 上下文視窗 — 無需分塊即可處理整個大型程式碼庫、完整的文檔集和長對話歷史。
- 原生電腦使用能力 — 透過程式化方式與桌面應用程式、瀏覽器和系統工具互動。
- 在 SWE-bench Pro 取得 57.7% — 頂尖的程式設計基準測試表現。
- 在 GDPval 知識任務取得 83% — 達到或超過行業專業人士水準。
- Token 效率高 — 每項任務產出的 output tokens 較少,儘管標稱價格較高。
何時使用 GPT-5.4
- 需要深度推理的複雜程式設計任務
- 多步驟自主工作流(透過 Codex CLI)
- 長上下文分析 (>400K tokens)
- 需要電腦使用能力的任務
- 任何需要目前最強模型的新專案
定價
| 層級 | 輸入 | 輸出 | 快取輸入 |
|---|---|---|---|
| Standard | $2.50/MTok | $10.00/MTok | $0.63/MTok |
GPT-5.4 Mini:平衡之選
GPT-5.4 Mini 繼承了 GPT-5.4 的架構,但成本和延遲更低。它專為需要良好推理能力但不想支付旗艦價格的應用而設計。
何時使用 GPT-5.4 Mini
- 重視每次請求成本的正式環境 API
- 需要在速度與品質間取得平衡的應用
- 中等複雜度的聊天機器人後端
- GPT-5.4 太大材小用,但 GPT-5.3 Instant 又不足以勝任的工作流
GPT-5.4 Nano:速度之王
GPT-5.4 Nano 針對最低延遲進行了優化。它犧牲了推理深度以換取極致速度。
何時使用 GPT-5.4 Nano
- 即時自動補全與建議
- 對延遲要求極高的正式環境端點
- 高流量、低複雜度的分類任務
- 回應時間至關重要的行動應用程式
GPT-5.3 Codex:程式設計專家
GPT-5.3 Codex 仍然是預算敏感、輸入密集型程式設計工作流的最佳模型。它的運行速度比 GPT-5.2 Codex 快 25%,且輸入 token 成本低於 GPT-5.4。
何時使用 GPT-5.3 Codex
- 終端機密集的批次程式設計操作
- 重複發送大型程式庫上下文的工作流
- 成本優化的代理程式設計流水線
- 400K 上下文視窗已足夠的任務
何時升級至 GPT-5.4
- 您需要超過 400K tokens 的上下文
- 您需要電腦使用能力
- 您需要程式設計之外的知識工作
- 43% 的輸入成本溢價值得換取更廣泛的能力
定價
| 層級 | 輸入 | 輸出 | 快取輸入 |
|---|---|---|---|
| Standard | $1.75/MTok | $7.00/MTok | $0.44/MTok |
GPT-5.3 Instant:日常主力
GPT-5.3 Instant 是最便宜的 GPT-5 模型,也是高流量、日常任務的最佳選擇。
核心優勢
- 幻覺比前代模型減少 26.8%
- 非常擅長:問答、教學、技術寫作、翻譯
- 最低成本:每百萬 tokens 約 ~$0.30/$1.20
- 高吞吐量:針對速度進行了優化
何時使用 GPT-5.3 Instant
- 客戶支援聊天機器人
- 大規模內容生成
- 翻譯與在地化
- 簡單問答系統
- 每次請求成本最為關鍵的高流量應用
定價
| 層級 | 輸入 | 輸出 |
|---|---|---|
| Standard | ~$0.30/MTok | ~$1.20/MTok |
GPT-5.2 Thinking:舊版(將於 June 2026 退役)
GPT-5.2 是之前的旗艦模型。它引入了三層架構(Instant, Thinking, and Pro),但在所有基準測試中均已被 GPT-5.4 取代。
遷移時間表
- 現在 → June 5, 2026:GPT-5.2 Thinking 在 Legacy Models 下可用
- June 5, 2026:GPT-5.2 Thinking 退役。API 調用將會失敗。
- 需要採取的行動:將
model參數從gpt-5.2-thinking更新為gpt-5.4
# Before (will stop working June 5, 2026)
model="gpt-5.2-thinking"
# After
model="gpt-5.4"
決策框架:該使用哪款模型
依使用場景
| 使用場景 | 推薦模型 | 原因 |
|---|---|---|
| 複雜程式設計 + 推理 | GPT-5.4 | 最強能力,1M 上下文 |
| 日常程式設計(預算敏感) | GPT-5.3 Codex | 輸入成本較低,強大的程式設計能力 |
| 通用聊天機器人/問答 | GPT-5.3 Instant | 最便宜、快速、低幻覺 |
| 正式環境 API(平衡型) | GPT-5.4 Mini | 品質優良,成本合理 |
| 即時自動補全 | GPT-5.4 Nano | 最低延遲 |
| 科學/研究 | GPT-5.4 | 最深度的推理 |
依預算
| 每月預算 | 策略 |
|---|---|
| <$50 | 全部使用 GPT-5.3 Instant |
| $50-200 | GPT-5.3 Instant + 程式設計使用 GPT-5.3 Codex |
| $200-1,000 | 預設使用 GPT-5.4,簡單任務使用 GPT-5.3 Instant |
| $1,000+ | 全部使用 GPT-5.4,或採用混合路由 |
路由模式 (Router Pattern)
正式環境應用中最具成本效益的方法:
Request → Classify Complexity
├── Simple (60%) → GPT-5.3 Instant ($0.30/MTok)
├── Medium (25%) → GPT-5.4 Mini
├── Complex (10%) → GPT-5.4 ($2.50/MTok)
└── Coding (5%) → GPT-5.3 Codex ($1.75/MTok)
與所有請求都使用 GPT-5.4 相比,這種模式可以降低 70-80% 的成本,且對品質影響極小。
GPT-5 vs 競爭對手
GPT-5 家族與 Claude 和 Gemini 相比表現如何?
| 模型 | 輸入成本 | SWE-Bench | 上下文 | 優勢 |
|---|---|---|---|---|
| GPT-5.4 | $2.50/MTok | 57.7% (Pro) | 1.05M | 最廣泛的能力 |
| Claude Opus 4.6 | $15/MTok | 80.8% (Verified) | 1M | 最深度的推理 |
| Claude Sonnet 4.6 | $3/MTok | 79.6% (Verified) | 1M | 性價比最高的推理 |
| Gemini 3.1 Pro | 變動 | 具競爭力 | 2M | 最大的上下文 |
每個模型家族都有其優勢。GPT-5.4 提供了最平衡的能力集;Claude 在程式設計基準測試中領先;Gemini 在上下文視窗大小方面領先。
API 之外:無程式碼開發
所有的 GPT-5 模型都是開發者的工具。無論是直接使用 GPT-5.4 還是透過 Codex CLI,您仍然需要程式設計知識來構建應用程式。
如果您想在不編寫程式碼的情況下開發應用程式,像 ZBuild 這樣的平台可以讓您用白話描述您的應用程式,並獲得完整的可用產品 —— 幕後由這些 AI 模型驅動。
總結
OpenAI 的 GPT-5 家族為每種使用場景和預算都提供了模型:
| 模型 | 一句話簡介 |
|---|---|
| GPT-5.4 | 整體表現最佳,如果不確定就選這款 |
| GPT-5.4 Mini | 速度與成本的良好平衡 |
| GPT-5.4 Nano | 最快,適用於對延遲要求極高的應用 |
| GPT-5.3 Codex | 大量程式設計時每 token 最便宜 |
| GPT-5.3 Instant | 整體最便宜,適用於日常任務 |
| GPT-5.2 | 將於 June 5 退役 — 請立即遷移 |
正確的選擇取決於您的工作負載、預算和延遲要求。如有疑問,請先從 GPT-5.4 開始,並在了解您的流量模式後優化至更便宜的模型。
由 ZBuild 團隊發佈。在 zbuild.io 上免程式碼開發應用程式。
來源
- OpenAI: Introducing GPT-5.4
- OpenAI: Introducing GPT-5.2
- OpenAI API Models
- OpenAI: Using GPT-5.4
- OpenAI Help Center: GPT-5.3 and GPT-5.4
- OpenAI Codex Models
- FelloAI: Ultimate ChatGPT Model Comparison
- Zapier: OpenAI Models Guide
- Nathan Lambert: GPT-5.4 Analysis