Gate 广場「創作者認證激勵計畫」優質創作者持續招募中!
立即加入,發布優質內容,參與活動即可瓜分月度 $10,000+ 創作獎勵!
認證申請步驟:
1️⃣ 打開 App 首頁底部【廣場】 → 點擊右上角頭像進入個人首頁
2️⃣ 點擊頭像右下角【申請認證】,提交申請等待審核
立即報名:https://www.gate.com/questionnaire/7159
豪華代幣獎池、Gate 精美周邊、流量曝光等超過 $10,000 的豐厚獎勵等你拿!
活動詳情:https://www.gate.com/announcements/article/47889
百度的 ERNIE 5 AI 模型登上排行榜——一個超越 OpenAI GPT 5.1 的數學天才
簡要說明
中國科技巨頭百度剛剛更新了其最先進的 AI 模型——顯然效果相當不錯。 該公司的 ERNIE-5.0-0110 在 LMArena 的文本排行榜上獲得 1460 分,全球排名第8,成為唯一進入平台前10的中國模型。它的排名超越了 OpenAI 的 GPT-5.1-High 和 Google 的 Gemini-2.5-Pro。ERNIE 4.0 於 2023 年發布。 ERNIE 5.0 在數學推理方面也位居全球第2,僅次於未發布的 GPT-5.2-High。對於一個中國模型來說,在複雜邏輯任務中超越幾乎所有公開的西方系統,標誌著 AI 能力差距的顯著縮小——或者說,差距正在縮小。
百度在 X 上的公告強調,ERNIE 5.0 已正式退出預覽階段。該模型在創意寫作、指令遵循和編碼方面也展現出競爭力——在科學、商業與金融、醫療等多個職業類別中都進入了前10名。
這些結果背後的技術架構遵循中國對效率而非純粹性能的重視。ERNIE 5.0 採用約 2 兆參數的專家混合架構(Mixture-of-Experts),每次推理只激活少部分專家 (更準確地說,僅 3%)。 與其他稀疏前沿模型類似,這種設計相比密集系統降低了每次查詢的計算量,但也增加了工程複雜性。百度還表示,ERNIE 5.0 在文本、圖像、音頻和視頻上原生訓練,而非將多模態模塊後置於純語言核心。公司稱這使得 Ernie 成為一個原生的“全模態” AI 模型。
考慮到百度曾經的跌落,這次反彈尤為值得注意。去年11月,ERNIE 5.0 的預覽版在 LMArena 上排名跌至第24名。國內 AI 市場由更靈活的競爭對手主導:字節跳動的抖寶擁有 1.01 億月活躍用戶,而深度尋找的成本效益模型引發了價格戰,迫使百度在去年四月完全放棄付費訂閱模式。 但消費者市場的挫折並未阻礙百度的企業推進。ERNIE 現在為中國的智慧城市指揮中心提供支援,服務所有系統性重要的中國銀行,並每天處理 165 億次 API 請求。這個 B2B 的堅實據點使百度免受激烈的消費者競爭,同時資助持續的模型開發。 除了大型語言模型的純粹算力外,ERNIE 聊天機器人的用戶界面也相當友好,並配備了預設的定制功能,幫助用戶根據需求獲得更貼合的結果。例如,系統不再要求用戶為不同任務輸入複雜提示,而是提供寫作、閱讀、圖像編輯和通用用途的獨立區域。雖然核心模型相同,但系統提示和微調的變化使每個任務都更容易完成。
有趣的是,最新版本未啟用網絡搜索功能,因此完全離線。不過,用戶可以切換到之前的 Ernie 4.5,啟用網絡搜索來獲取更新資訊。 反應褒貶不一,有些用戶仍在等待更詳細的模型性能和基準測試分析,該公司承諾將很快發布。此外,值得注意的是,雖然 ERNIE 5.0 在某些基準上與 GPT-5 和 Gemini 2.5 相媲美,但許多西方實驗室已經轉向 GPT-5.2 或 Gemini 3,這更像是追趕而非領先的飛躍。 用戶可以在 ernie.baidu.com 免費測試該模型。