真正的突破有时候不用非得宣传,圈内人自然就能看懂。



Sentient最近推出的ROMA就属于这一类。在神经信息处理系统会议上演示的递归开放元代理架构,在SEALQA难度最高的SEAL0测试集上跑出45.6%的准确率——直接把开源推理模型的性能上限又往上推了一个台阶。

數字本身已經說明問題,但更重要的是這背後的技術思路走對了方向。這不僅是分數的提升,更是整個推理框架的迭代突破。
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 8
  • 轉發
  • 分享
留言
0/400
椰子丝半仙vip
· 01-13 18:06
45.6%這個數字確實扎眼,不過關鍵還是那個框架思路對不對吧
查看原文回復0
AirdropCollectorvip
· 01-12 22:31
45.6%這個數字是真的絕,但好奇遞歸元代理到底比之前的方案好在哪...
查看原文回復0
跑路预言家vip
· 01-12 07:42
45.6%這個數字確實能看,但SEAL0難度真的有那麼悬嗎
查看原文回復0
ForkYouPayMevip
· 01-10 19:51
45.6%這個數字有點意思,但真正讓我關注的是那個遞歸架構思路
查看原文回復0
LidoStakeAddictvip
· 01-10 19:49
45.6%這個數字確實能看出點東西,但ROMA的架構思路才是關鍵啊
查看原文回復0
MrRightClickvip
· 01-10 19:48
45.6%這個數字確實不錯,不過SEAL0測試集本身的難度怎麼界定的來著?
查看原文回復0
CryptoMotivatorvip
· 01-10 19:46
45.6%這數字確實撐不住了,遞歸架構這路子算是找到感覺了
查看原文回復0
多签失败大师vip
· 01-10 19:32
45.6%?哈,這數字確實有點意思啊 低調的東西往往最能打,可惜懂的人太少了 ROMA這個框架邏輯我得再研究研究,感覺路子是對的
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)