我應該使用哪款 GPT-5 模型？

對於複雜的 reasoning 和 coding，請將 GPT-5.4 作為您的預設模型。對於低成本的快速日常任務，請使用 GPT-5.3 Instant。對於具有大量 input 且對成本敏感的 coding，請使用 GPT-5.3 Codex。GPT-5.4 Mini 和 Nano 最適合對 latency 敏感的 production 應用。

總共有多少款 GPT-5 模型？

OpenAI 目前提供 6 款 GPT-5 系列模型：GPT-5.4 (flagship), GPT-5.4 Mini (balanced), GPT-5.4 Nano (fastest), GPT-5.3 Codex (coding specialist), GPT-5.3 Instant (everyday tasks), 以及 GPT-5.2 Thinking (legacy, 將於 June 2026 退役)。

GPT-5.4 的 context window 是多少？

GPT-5.4 透過 API 提供 1,050,000-token 的 context window — 這是 GPT-5 系列中最大的。GPT-5.3 Codex 擁有 400,000 tokens。這使得 GPT-5.4 能夠在單個 context 中處理整個大型 codebases。

GPT-5.4 的費用是多少？

GPT-5.4 的費用為每百萬 input tokens $2.50，以及每百萬 output tokens $10.00。Cached input 費用為每百萬 tokens $0.63。它比 GPT-5.3 模型更昂貴，但在每個任務中更具 token-efficient。

GPT-5.2 會退役嗎？

是的。GPT-5.2 Thinking 將於 June 5, 2026 退役。OpenAI 建議遷移至 GPT-5.4，其在所有 benchmarks 的能力表現均超越了 GPT-5.2。

GPT-5.3 Instant 適合用於什麼？

GPT-5.3 Instant 針對高吞吐量的日常任務進行了優化，價格約為每百萬 tokens $0.30/$1.20 — 是最便宜的 GPT-5 模型。它擅長 Q&A, how-tos, technical writing, 與 translation，且其 hallucinations 比前代產品減少了 26.8%。

核心摘要

GPT-5.4 是新的預設模型：2026年3月5日發佈，它結合了 GPT-5.3 Codex 的程式設計實力與更廣泛的推理能力、1M-tokens 的上下文視窗，以及原生的電腦使用能力。
六款模型滿足不同需求：旗艦款 (5.4)、平衡款 (5.4 Mini)、快速款 (5.4 Nano)、程式設計專家 (5.3 Codex)、日常任務 (5.3 Instant) 以及舊版 (5.2 Thinking)。
價格跨度達 10 倍：從輸入每 $0.30/MTok (GPT-5.3 Instant) 到 $2.50/MTok (GPT-5.4) —— 選擇正確的模型將直接影響您的帳單。
GPT-5.2 將於 June 5 退役：立即遷移以避免服務中斷。

OpenAI GPT-5 模型家族完全指南

OpenAI 的 GPT-5 家族已發展出六款不同的模型，每款模型都針對能力、速度和成本之間的權衡進行了優化。選擇錯誤的模型意味著要麼為簡單任務支付過高費用，要麼在複雜任務中動力不足。

本指南涵蓋了每款模型，包含定價、基準測試和明確的決策框架。

全系列陣容 (March 2026)

模型	角色	輸入成本	輸出成本	上下文	發佈日期
GPT-5.4	旗艦推理 + 程式設計	$2.50/MTok	$10.00/MTok	1.05M	Mar 5, 2026
GPT-5.4 Mini	快速平衡	較低	較低	較小	Mar 2026
GPT-5.4 Nano	最低延遲	最低	最低	最小	Mar 2026
GPT-5.3 Codex	程式設計專家	$1.75/MTok	$7.00/MTok	400K	Mar 3, 2026
GPT-5.3 Instant	日常任務	~$0.30/MTok	~$1.20/MTok	標準	Mar 3, 2026
GPT-5.2 Thinking	舊版旗艦	較高	較高	較小	之前

資料來源：OpenAI API Models, FelloAI Comparison

GPT-5.4：全新旗艦模型

GPT-5.4 是 OpenAI 目前最強大的模型 —— 這是首個在單一架構中結合了尖端推理與尖端程式設計能力的模型。

核心特色

1,050,000-tokens 上下文視窗 — 無需分塊即可處理整個大型程式碼庫、完整的文檔集和長對話歷史。
原生電腦使用能力 — 透過程式化方式與桌面應用程式、瀏覽器和系統工具互動。
在 SWE-bench Pro 取得 57.7% — 頂尖的程式設計基準測試表現。
在 GDPval 知識任務取得 83% — 達到或超過行業專業人士水準。
Token 效率高 — 每項任務產出的 output tokens 較少，儘管標稱價格較高。

何時使用 GPT-5.4

需要深度推理的複雜程式設計任務
多步驟自主工作流（透過 Codex CLI）
長上下文分析 (>400K tokens)
需要電腦使用能力的任務
任何需要目前最強模型的新專案

定價

層級	輸入	輸出	快取輸入
Standard	$2.50/MTok	$10.00/MTok	$0.63/MTok

GPT-5.4 Mini：平衡之選

GPT-5.4 Mini 繼承了 GPT-5.4 的架構，但成本和延遲更低。它專為需要良好推理能力但不想支付旗艦價格的應用而設計。

何時使用 GPT-5.4 Mini

重視每次請求成本的正式環境 API
需要在速度與品質間取得平衡的應用
中等複雜度的聊天機器人後端
GPT-5.4 太大材小用，但 GPT-5.3 Instant 又不足以勝任的工作流

GPT-5.4 Nano：速度之王

GPT-5.4 Nano 針對最低延遲進行了優化。它犧牲了推理深度以換取極致速度。

何時使用 GPT-5.4 Nano

即時自動補全與建議
對延遲要求極高的正式環境端點
高流量、低複雜度的分類任務
回應時間至關重要的行動應用程式

GPT-5.3 Codex：程式設計專家

GPT-5.3 Codex 仍然是預算敏感、輸入密集型程式設計工作流的最佳模型。它的運行速度比 GPT-5.2 Codex 快 25%，且輸入 token 成本低於 GPT-5.4。

何時使用 GPT-5.3 Codex

終端機密集的批次程式設計操作
重複發送大型程式庫上下文的工作流
成本優化的代理程式設計流水線
400K 上下文視窗已足夠的任務

何時升級至 GPT-5.4

您需要超過 400K tokens 的上下文
您需要電腦使用能力
您需要程式設計之外的知識工作
43% 的輸入成本溢價值得換取更廣泛的能力

定價

層級	輸入	輸出	快取輸入
Standard	$1.75/MTok	$7.00/MTok	$0.44/MTok

GPT-5.3 Instant：日常主力

GPT-5.3 Instant 是最便宜的 GPT-5 模型，也是高流量、日常任務的最佳選擇。

核心優勢

幻覺比前代模型減少 26.8%
非常擅長：問答、教學、技術寫作、翻譯
最低成本：每百萬 tokens 約 ~$0.30/$1.20
高吞吐量：針對速度進行了優化

何時使用 GPT-5.3 Instant

客戶支援聊天機器人
大規模內容生成
翻譯與在地化
簡單問答系統
每次請求成本最為關鍵的高流量應用

定價

層級	輸入	輸出
Standard	~$0.30/MTok	~$1.20/MTok

GPT-5.2 Thinking：舊版（將於 June 2026 退役）

GPT-5.2 是之前的旗艦模型。它引入了三層架構（Instant, Thinking, and Pro），但在所有基準測試中均已被 GPT-5.4 取代。

遷移時間表

現在 → June 5, 2026：GPT-5.2 Thinking 在 Legacy Models 下可用
June 5, 2026：GPT-5.2 Thinking 退役。API 調用將會失敗。
需要採取的行動：將 model 參數從 gpt-5.2-thinking 更新為 gpt-5.4

# Before (will stop working June 5, 2026)
model="gpt-5.2-thinking"

# After
model="gpt-5.4"

決策框架：該使用哪款模型

依使用場景

使用場景	推薦模型	原因
複雜程式設計 + 推理	GPT-5.4	最強能力，1M 上下文
日常程式設計（預算敏感）	GPT-5.3 Codex	輸入成本較低，強大的程式設計能力
通用聊天機器人/問答	GPT-5.3 Instant	最便宜、快速、低幻覺
正式環境 API（平衡型）	GPT-5.4 Mini	品質優良，成本合理
即時自動補全	GPT-5.4 Nano	最低延遲
科學/研究	GPT-5.4	最深度的推理

依預算

每月預算	策略
<$50	全部使用 GPT-5.3 Instant
$50-200	GPT-5.3 Instant + 程式設計使用 GPT-5.3 Codex
$200-1,000	預設使用 GPT-5.4，簡單任務使用 GPT-5.3 Instant
$1,000+	全部使用 GPT-5.4，或採用混合路由

路由模式 (Router Pattern)

正式環境應用中最具成本效益的方法：

Request → Classify Complexity
  ├── Simple (60%) → GPT-5.3 Instant ($0.30/MTok)
  ├── Medium (25%) → GPT-5.4 Mini
  ├── Complex (10%) → GPT-5.4 ($2.50/MTok)
  └── Coding (5%)  → GPT-5.3 Codex ($1.75/MTok)

與所有請求都使用 GPT-5.4 相比，這種模式可以降低 70-80% 的成本，且對品質影響極小。

GPT-5 vs 競爭對手

GPT-5 家族與 Claude 和 Gemini 相比表現如何？

模型	輸入成本	SWE-Bench	上下文	優勢
GPT-5.4	$2.50/MTok	57.7% (Pro)	1.05M	最廣泛的能力
Claude Opus 4.6	$15/MTok	80.8% (Verified)	1M	最深度的推理
Claude Sonnet 4.6	$3/MTok	79.6% (Verified)	1M	性價比最高的推理
Gemini 3.1 Pro	變動	具競爭力	2M	最大的上下文

每個模型家族都有其優勢。GPT-5.4 提供了最平衡的能力集；Claude 在程式設計基準測試中領先；Gemini 在上下文視窗大小方面領先。

API 之外：無程式碼開發

所有的 GPT-5 模型都是開發者的工具。無論是直接使用 GPT-5.4 還是透過 Codex CLI，您仍然需要程式設計知識來構建應用程式。

如果您想在不編寫程式碼的情況下開發應用程式，像 ZBuild 這樣的平台可以讓您用白話描述您的應用程式，並獲得完整的可用產品 —— 幕後由這些 AI 模型驅動。

免費試用 ZBuild →

總結

OpenAI 的 GPT-5 家族為每種使用場景和預算都提供了模型：

模型	一句話簡介
GPT-5.4	整體表現最佳，如果不確定就選這款
GPT-5.4 Mini	速度與成本的良好平衡
GPT-5.4 Nano	最快，適用於對延遲要求極高的應用
GPT-5.3 Codex	大量程式設計時每 token 最便宜
GPT-5.3 Instant	整體最便宜，適用於日常任務
GPT-5.2	將於 June 5 退役 — 請立即遷移

正確的選擇取決於您的工作負載、預算和延遲要求。如有疑問，請先從 GPT-5.4 開始，並在了解您的流量模式後優化至更便宜的模型。

由 ZBuild 團隊發佈。在 zbuild.io 上免程式碼開發應用程式。

OpenAI GPT-5 Model Guide: 每種模型的詳細說明 (March 2026)