加密貨幣首次進行專家級 AI 壓力測試。一家 Web3 AI 公司與普林斯頓大學的 AI 實驗室合作推出了 CryptoBench——基本上是一個動態基準測試,用來觀察大型語言模型代理在加密貨幣實戰中的實際表現。王夢迪教授及其博士研究生顧昕共同開發了這個系統,旨在將 AI 模型從一般任務推向專業的加密場景。這是實戰評估,而不僅僅是課本理論。這有可能成為衡量 AI 加密能力的標準嗎?行業正密切關注。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 6
  • 轉發
  • 分享
留言
0/400
shadowy_supercodervip
· 12-11 14:38
ngl cryptobench 聽起來有點太理想化了,實際跑起來行不行另說
查看原文回復0
QuorumVotervip
· 12-11 10:58
cryptobench聽起來唬人但也就那樣,真正能解決滑點問題嗎? --- 普林斯頓搞的benchmark我信,但這玩意兒能跑贏市場才是硬道理 --- 又一個"革命性"測試...等等結果再說吧 --- llm agent做交易?先別吹,給我看看實盤數據 --- 話題不錯,就怕成了另一個行銷噱頭
查看原文回復0
区块考古学家vip
· 12-10 20:10
普林斯顿搞這套CryptoBench還是有點東西的,終於有人敢測AI在幣圈的真實戰鬥力了
查看原文回復0
链游韭菜收割机vip
· 12-10 20:06
嘿呀,普林斯顿出手了,这下crypto圈的AI得认真卷起来了 CryptoBench听起来还不错,就是不知道最后能不能真的干掉那些花瓶模型 等等,这玩意儿能测出哪些AI适合撸毛吗...算了想太多 终于有人认真搞这事儿了,别再拿通用模型来糊弄我们 Princeton聯動Web3,這組合我喜歡,實戰才是檢驗真理的唯一標準啦
查看原文回復0
bridgeOopsvip
· 12-10 19:47
ngl cryptobench聽起來挺硬的,終於有人搞實戰測試了,不是光吹牛 等等這玩意真能成標準嗎,得看後續有沒有人跟進啊 哈哈ai進軍幣圈了,這下子機器人也要學炒幣了
查看原文回復0
元宇宙资深流浪汉vip
· 12-10 19:41
普林斯顿出手了,这下AI模型们是要真刀真枪干活了,光吹牛逼没用 CryptoBench这东西要真能成标准,得看业内怎么买账,目前还太早说 又是benchmark又是stress test,感觉每周都在造新概念...不过专门针对crypto场景倒是新意 想看看这套评估体系实际跑起来效果咋样,会不会又是论文漂亮实战拉胯
回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)