GPT-5.5 已到來,AI 競賽再次轉變節奏



剛剛發生了什麼
2026年4月23日,OpenAI 正式發布了代號為「Spud」的 GPT-5.5,這是其迄今為止最強大且最智能的模型。此次發布正好是在 GPT-5.4 於3月5日推出六週後,以及在競爭對手 Anthropic 剛剛推出自己的最新模型一週後。這個發布週期的速度並非偶然,而是直接反映了當前前沿 AI 軍備競賽的激烈升級。OpenAI 總裁 Greg Brockman 將 GPT-5.5 描述為「一個新類別的智能」以及「邁向更具代理性和直覺性計算的重要一步」。截至2026年4月24日,GPT-5.5 和 GPT-5.5 Pro 也已在 API 中上線,系統卡片已更新以加入額外的網絡安全防護措施。這是史上最快的 AI 發展週期,而 GPT-5.5 則是其最新的里程碑。

GPT-5.5 實際上有何不同
GPT-5.5 的核心突破不僅在於純粹的智能,而在於自主執行能力。之前的模型需要謹慎的逐步提示來避免錯誤。GPT-5.5 從根本上改變了這一點。你可以將一個雜亂、多部分的任務交給它,沒有結構化指令,它也能自主規劃方案、選擇合適的工具、檢查自己的工作、應對模糊性,並持續進行直到任務完成。OpenAI 將這種「代理性」行為稱為模型更像一個獨立工作者,而非你手動操作的工具。

性能提升在四個領域尤為明顯。在代理編碼方面,GPT-5.5 在 Terminal-Bench 2.0 上得分 82.7%,而 Anthropic 的 Claude Opus 4.7 則為 69.4%。在數學方面,GPT-5.5 Pro 在 FrontierMath Tier 4 的博士後級數學問題中得分 39.6%,幾乎是 Claude Opus 4.7 的 22.9% 的兩倍,這些問題人類專家可能需要數天才能解決。在電腦操作方面,模型能瀏覽軟體、點擊網頁應用、截圖並反覆迭代直到任務完成。在科學研究方面,GPT-5.5 已協助研究人員發現與拉姆數相關的新數學證明,OpenAI 表示相信該模型能真正幫助專家科學家加速藥物發現和基礎研究。

除了純粹的分數外,GPT-5.5 在完成相同 Codex 任務時,使用的標記數明顯少於 GPT-5.4,這使得它在成本效率上更優,儘管價格較高。它在實際服務中每個標記的延遲時間也與 GPT-5.4 相當,意味著在同樣速度下擁有更高的智能。對企業用戶來說,紐約銀行的首席資訊官報告稱,模型在抗幻覺方面有顯著改善,這是受監管機構的關鍵需求。「我們看到這個模型帶來了質的飛躍,」她在簡報中證實。

兩個版本 GPT-5.5 和 GPT-5.5 Pro
OpenAI 發布了兩個不同層級的 GPT-5.5。標準版 GPT-5.5 可供 Plus、Pro、Business 和 Enterprise 訂閱者通過 ChatGPT 和 Codex 使用,並在編碼、電腦操作、知識工作和文件創建方面帶來強勁提升。GPT-5.5 Pro 在商業、法律、教育和數據科學等用例中提供顯著更高的質量改進,僅向 Pro、Business 和 Enterprise 訂閱者開放。從4月24日起,API 端點的 GPT-5.5 價格為每百萬輸入標記 $5 ,每百萬輸出標記 $30 。GPT-5.5 Pro 的價格則為每百萬輸入標記 $30 ,每百萬輸出標記 $180 。批量和彈性定價為標準價格的一半。優先處理則為標準價格的2.5倍。兩個版本都保持1百萬標記的上下文窗口。

OpenAI 目前的數據背後
GPT-5.5 的發布伴隨著一系列平台統計數據,OpenAI 明確希望市場注意。ChatGPT 現在每週活躍用戶超過9億。平台上付費訂閱用戶超過5000萬。商業部門已達到900萬付費企業用戶。OpenAI 的 AI 編碼助手 Codex 有400萬活躍用戶。這些數字很重要,因為近期形成了一個敘事,認為 OpenAI 在企業市場上逐漸失去優勢,逐步被 Anthropic 超越。而 GPT-5.5 的推出,配合這些用戶數據,則是 OpenAI 針對該敘事的直接反擊。

Anthropic 競爭誰在贏
在2026年4月,OpenAI 與 Anthropic 之間的競爭比以往任何時候都更為明顯和激烈。Anthropic 在 GPT-5.5 推出前一週發布了 Claude Opus 4.7。OpenAI 七天後回應,推出一款在多項基準測試中優於 Claude Opus 4.7 的模型。在新聞發布會上,記者直接詢問 GPT-5.5 是否能匹配 Anthropic 最近因未經授權存取報告而引發爭議的 Mythos 高級網絡安全模型。OpenAI 研究副總裁 Mia Glaese 表示,公司有一個堅實且持久的長期網絡安全策略,GPT-5.5 反映了數月來在網絡安全框架上的反覆優化。

OpenAI 展示的基準比較顯示,GPT-5.5 在大多數測試類別中持續超越 Claude Opus 4.7。然而,值得注意的是,受控環境中的基準表現並不總是能直接轉化為實際工作流程中的優勢,企業客戶通常會在內部進行評估後才做出模型選擇。這場比賽是真正激烈的,兩家公司都沒有絕對且永久的領先。

GPT-5.5 對 AI 經濟的意義
OpenAI 總裁 Greg Brockman 在簡報中發表的聲明值得關注,超越了技術規格。「我們正朝著一個由計算推動的經濟體系邁進,」他說,認為 AI 計算能力和基礎設施將成為未來經濟活動的基石。GPT-5.5 是朝這個願景邁出的具體一步。該模型內部優化了 OpenAI 自家的 GPU 基礎設施管理軟體,開發出一個更高效的批次排程算法,使標記生成速度提升超過20%。這是一種在基礎設施層面進行的自我改進,具有長遠的深遠影響。

Nvidia 在這個故事中的角色同樣重要。GPT-5.5 在 Nvidia 的 GB200 和 GB300 NVL72 系統上訓練,配備 Blackwell B200 和 Blackwell Ultra GPU。Nvidia 確認其最新晶片將運行高級 AI 模型(如 GPT-5.5)的成本比前幾代降低最多35倍。對於加密和科技投資社群來說,這證實了持續的論點:AI 計算基礎設施,尤其是 Nvidia 的晶片生態系統,目前仍是全球科技經濟中最有價值的基礎層。

安全性與 OpenAI 這次的不同做法
GPT-5.5 發布時,OpenAI 描述其為迄今為止最強的安全與防護框架。近200個可信的早期接入合作夥伴在公開發布前測試了實際用例。內部和外部的紅隊測試專門針對高級網絡安全和生物能力進行。API 部署比 ChatGPT 消費者版本多了額外的安全措施,這也是為何在主發布後,API 進入初期延遲了一天。OpenAI 對 GPT-5.5 的做法反映了行業普遍的轉變,即將安全測試作為發布前的必要條件,而非事後的關注點,尤其是在模型能自主進行多步操作的情況下。

這對普通用戶和企業意味著什麼
對於 Plus 及以上計劃的個人用戶,GPT-5.5 意味著完成複雜任務所需的提示次數減少。早期團隊報告稱,使用 GPT-5.5 進行代碼審查、檢查大量文件集和自主處理多步研究任務,每週可節省多達10小時的工作時間。對於企業團隊來說,改進的抗幻覺能力、更好的代碼除錯、擴展的瀏覽器功能(在 Codex 中)以及自主運行軟體的能力,都是實實在在的生產力提升。對於基於 API 開發的開發者來說,1百萬標記的上下文窗口、改進的代理性能和具有競爭力的價格,使 GPT-5.5 成為當前最強大的基礎模型,用於構建 AI 驅動的應用。

最終結論
GPT-5.5 並非一個微小的增量更新,而是在自主能力、效率以及在實際企業環境中的可靠性方面的質的飛躍。GPT-5.4 與 GPT-5.5 之間六週的發布週期,彰顯了 OpenAI 致力於在2026年保持不懈的發展速度。AI 競賽已不再是哪家公司打造出最聰明模型的比拼,而是看哪個平台能最深層次融入人們和企業的日常工作。GPT-5.5 是 OpenAI 在這一目標上最強有力的推進。
查看原文
post-image
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
內容包含 AI 生成部分
  • 打賞
  • 7
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
Ryakpanda
· 12分鐘前
就冲就完了 👊
查看原文回復0
GateUser-68291371
· 18分鐘前
緊緊抓住 💪
查看原文回復0
GateUser-68291371
· 18分鐘前
跳上去 🚀
查看原文回復0
ybaser
· 33分鐘前
2026 GOGOGO 👊
回復0
ybaser
· 33分鐘前
到月球 🌕
查看原文回復0
AylaShinex
· 2小時前
到月球 🌕
查看原文回復0
AylaShinex
· 2小時前
2026 GOGOGO 👊
回復0