百度的 ERNIE 5 AI 模型登上排行榜——一個超越 OpenAI GPT 5.1 的數學天才

簡要說明

  • 百度最新的 ERNIE 5.0 在全球 AI 模型中佔有一席之地,在 LMArena 的文本排行榜中獲得 1,460 分,全球排名第8,成為唯一突破前10名的中國模型,超越了 OpenAI 的 GPT-5.1-High 和 Google 的 Gemini-2.5-Pro。ERNIE v4.0 於 2023 年發布。
  • ERNIE 4.0 於兩年前推出。
  • 強大的企業採用抵消了百度在激烈的國內競爭中的消費者 AI 挫折。

中國科技巨頭百度剛剛更新了其最先進的 AI 模型——顯然效果相當不錯。 該公司的 ERNIE-5.0-0110 在 LMArena 的文本排行榜上獲得 1460 分,全球排名第8,成為唯一進入平台前10的中國模型。它的排名超越了 OpenAI 的 GPT-5.1-High 和 Google 的 Gemini-2.5-Pro。ERNIE 4.0 於 2023 年發布。 ERNIE 5.0 在數學推理方面也位居全球第2,僅次於未發布的 GPT-5.2-High。對於一個中國模型來說,在複雜邏輯任務中超越幾乎所有公開的西方系統,標誌著 AI 能力差距的顯著縮小——或者說,差距正在縮小。

沒錯,數學全球第2讓 ERNIE 現在進入了一個完全不同的對話。

— Muhammad Ayan (@socialwithaayan) 2026年1月15日

百度在 X 上的公告強調,ERNIE 5.0 已正式退出預覽階段。該模型在創意寫作、指令遵循和編碼方面也展現出競爭力——在科學、商業與金融、醫療等多個職業類別中都進入了前10名。

🚨 突發:@Baidu_inc 的 ERNIE-5.0-0110 剛在 LMArena 上取得了令人印象深刻的成績。這不是測試或預覽。

在最新排名中,該模型在文本基準測試中得分1460,位居中國模型第一,並進入全球前10名——唯一的中國模型… pic.twitter.com/9iBVzDcqgq

— Doreen (@dee_naliaks) 2026年1月15日

這些結果背後的技術架構遵循中國對效率而非純粹性能的重視。ERNIE 5.0 採用約 2 兆參數的專家混合架構(Mixture-of-Experts),每次推理只激活少部分專家 (更準確地說,僅 3%)。 與其他稀疏前沿模型類似,這種設計相比密集系統降低了每次查詢的計算量,但也增加了工程複雜性。百度還表示,ERNIE 5.0 在文本、圖像、音頻和視頻上原生訓練,而非將多模態模塊後置於純語言核心。公司稱這使得 Ernie 成為一個原生的“全模態” AI 模型。

考慮到百度曾經的跌落,這次反彈尤為值得注意。去年11月,ERNIE 5.0 的預覽版在 LMArena 上排名跌至第24名。國內 AI 市場由更靈活的競爭對手主導:字節跳動的抖寶擁有 1.01 億月活躍用戶,而深度尋找的成本效益模型引發了價格戰,迫使百度在去年四月完全放棄付費訂閱模式。 但消費者市場的挫折並未阻礙百度的企業推進。ERNIE 現在為中國的智慧城市指揮中心提供支援,服務所有系統性重要的中國銀行,並每天處理 165 億次 API 請求。這個 B2B 的堅實據點使百度免受激烈的消費者競爭,同時資助持續的模型開發。 除了大型語言模型的純粹算力外,ERNIE 聊天機器人的用戶界面也相當友好,並配備了預設的定制功能,幫助用戶根據需求獲得更貼合的結果。例如,系統不再要求用戶為不同任務輸入複雜提示,而是提供寫作、閱讀、圖像編輯和通用用途的獨立區域。雖然核心模型相同,但系統提示和微調的變化使每個任務都更容易完成。

有趣的是,最新版本未啟用網絡搜索功能,因此完全離線。不過,用戶可以切換到之前的 Ernie 4.5,啟用網絡搜索來獲取更新資訊。 反應褒貶不一,有些用戶仍在等待更詳細的模型性能和基準測試分析,該公司承諾將很快發布。此外,值得注意的是,雖然 ERNIE 5.0 在某些基準上與 GPT-5 和 Gemini 2.5 相媲美,但許多西方實驗室已經轉向 GPT-5.2 或 Gemini 3,這更像是追趕而非領先的飛躍。 用戶可以在 ernie.baidu.com 免費測試該模型。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)