百度的 ERNIE 5 AI 模型登上排行榜——一個超越 OpenAI GPT 5.1 的數學天才

2026-01-15 20:41:03

簡要說明

百度最新的 ERNIE 5.0 在全球 AI 模型中佔有一席之地，在 LMArena 的文本排行榜中獲得 1,460 分，全球排名第8，成為唯一突破前10名的中國模型，超越了 OpenAI 的 GPT-5.1-High 和 Google 的 Gemini-2.5-Pro。ERNIE v4.0 於 2023 年發布。
ERNIE 4.0 於兩年前推出。
強大的企業採用抵消了百度在激烈的國內競爭中的消費者 AI 挫折。

中國科技巨頭百度剛剛更新了其最先進的 AI 模型——顯然效果相當不錯。該公司的 ERNIE-5.0-0110 在 LMArena 的文本排行榜上獲得 1460 分，全球排名第8，成為唯一進入平台前10的中國模型。它的排名超越了 OpenAI 的 GPT-5.1-High 和 Google 的 Gemini-2.5-Pro。ERNIE 4.0 於 2023 年發布。 ERNIE 5.0 在數學推理方面也位居全球第2，僅次於未發布的 GPT-5.2-High。對於一個中國模型來說，在複雜邏輯任務中超越幾乎所有公開的西方系統，標誌著 AI 能力差距的顯著縮小——或者說，差距正在縮小。

沒錯，數學全球第2讓 ERNIE 現在進入了一個完全不同的對話。

— Muhammad Ayan (@socialwithaayan) 2026年1月15日

百度在 X 上的公告強調，ERNIE 5.0 已正式退出預覽階段。該模型在創意寫作、指令遵循和編碼方面也展現出競爭力——在科學、商業與金融、醫療等多個職業類別中都進入了前10名。

🚨 突發：@Baidu_inc 的 ERNIE-5.0-0110 剛在 LMArena 上取得了令人印象深刻的成績。這不是測試或預覽。

在最新排名中，該模型在文本基準測試中得分1460，位居中國模型第一，並進入全球前10名——唯一的中國模型… pic.twitter.com/9iBVzDcqgq

— Doreen (@dee_naliaks) 2026年1月15日

這些結果背後的技術架構遵循中國對效率而非純粹性能的重視。ERNIE 5.0 採用約 2 兆參數的專家混合架構（Mixture-of-Experts），每次推理只激活少部分專家 (更準確地說，僅 3%)。與其他稀疏前沿模型類似，這種設計相比密集系統降低了每次查詢的計算量，但也增加了工程複雜性。百度還表示，ERNIE 5.0 在文本、圖像、音頻和視頻上原生訓練，而非將多模態模塊後置於純語言核心。公司稱這使得 Ernie 成為一個原生的“全模態” AI 模型。

考慮到百度曾經的跌落，這次反彈尤為值得注意。去年11月，ERNIE 5.0 的預覽版在 LMArena 上排名跌至第24名。國內 AI 市場由更靈活的競爭對手主導：字節跳動的抖寶擁有 1.01 億月活躍用戶，而深度尋找的成本效益模型引發了價格戰，迫使百度在去年四月完全放棄付費訂閱模式。但消費者市場的挫折並未阻礙百度的企業推進。ERNIE 現在為中國的智慧城市指揮中心提供支援，服務所有系統性重要的中國銀行，並每天處理 165 億次 API 請求。這個 B2B 的堅實據點使百度免受激烈的消費者競爭，同時資助持續的模型開發。除了大型語言模型的純粹算力外，ERNIE 聊天機器人的用戶界面也相當友好，並配備了預設的定制功能，幫助用戶根據需求獲得更貼合的結果。例如，系統不再要求用戶為不同任務輸入複雜提示，而是提供寫作、閱讀、圖像編輯和通用用途的獨立區域。雖然核心模型相同，但系統提示和微調的變化使每個任務都更容易完成。

有趣的是，最新版本未啟用網絡搜索功能，因此完全離線。不過，用戶可以切換到之前的 Ernie 4.5，啟用網絡搜索來獲取更新資訊。反應褒貶不一，有些用戶仍在等待更詳細的模型性能和基準測試分析，該公司承諾將很快發布。此外，值得注意的是，雖然 ERNIE 5.0 在某些基準上與 GPT-5 和 Gemini 2.5 相媲美，但許多西方實驗室已經轉向 GPT-5.2 或 Gemini 3，這更像是追趕而非領先的飛躍。用戶可以在 ernie.baidu.com 免費測試該模型。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。