Anthropic宣布解鎖Opus 4.6百萬Token不加價!上下文測試碾壓GPT-5.4

動區BlockTempo

Anthropic 宣布 Claude Opus 4.6 與 Sonnet 4.6 的百萬 Token 上下文視窗正式 GA,定價維持不變;長上下文測試 MRCR v2 中,Opus 4.6 以 78.3% 大幅領先 GPT-5.4(36.6%)與 Gemini 3.1 Pro(25.9%)。
(前情提要:Claude Opus 4.6 來了:自己寫編譯器、做 PPT、隨手挖出 500 個零日漏洞,你的工作它都想試試)
(背景補充:Google 的 Gemini 3 Deep Think 大升級:推理能力強壓 Opus 4.6、GPT-5.2,要做「最會科研的 AI」)

Anthropicn 正式宣布,旗下 Claude Opus 4.6 與 Claude Sonnet 4.6 的百萬 Token 上下文視窗(1M Token Context Window)已從 Beta 階段全面升為正式版(GA),即日起向所有使用者開放,且定價不做任何調整。

此次 GA 最大亮點在於「不加價」。Opus 4.6 維持輸入 $5、輸出 $25(每百萬 Token),Sonnet 4.6 則維持輸入 $3、輸出 $15,且從第 1 個到第 100 萬個 Token 採用統一單價,不設分層計費。

用來寫程式的開發者可以一次塞進更大的程式庫的原始碼、數百頁研究報告,或長篇合約檔案。

MRCR v2 基準測試:Opus 4.6 大幅領先對手

Anthropic 同步公布長上下文能力的基準測試結果,採用 MRCR v2 評估框架,測試模型在超長文字中的資訊檢索與推理能力:

  • Claude Opus 4.6:78.3%
  • GPT-5.4:36.6%
  • Gemini 3.1 Pro:25.9%

Opus 4.6 得分幾乎是 GPT-5.4 的兩倍以上,遠超 Google Gemini 3.1 Pro。這對要處理超長合約、法律檔案、大型程式碼庫或多輪對話記錄的企業使用者,相當有價值。

Gemini 系列雖以支援 200 萬 Token 的超長上下文著稱,但 MRCR v2 的結果顯示,視窗「容量」與實際「理解品質」之間仍存在明顯落差,Anthropic 顯然希望以此區隔競爭對手。

Claude Code 整合程式庫分析、600 頁 PDF 單次處理

在應用層面,百萬 Token 上下文已在開發者工具 Claude Code 中全面啟用。官方強調,這能大幅緩解大型程式庫分析與日誌(log)檢索時的上下文壓縮問題,開發者無需再手動切割輸入或擔心重要資訊被截斷。

包括單次請求最多可處理 600 張圖片,或 600 頁 PDF 檔案。對需要對照大量技術檔案、審查長篇稽核報告,或一次性分析整個開源專案原始碼的場景。

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.
Commentaire
0/400
Aucun commentaire