加密货币刚刚经历了首次专家级AI压力测试。一家Web3 AI公司与普林斯顿的AI实验室合作推出了CryptoBench——这基本上是一个动态基准测试,旨在观察大型语言模型代理在加密货币这个真实世界中的表现。王梦迪教授及其博士研究员顾嘉诚共同开发了这个工具,它旨在将AI模型从通用任务推向专业的加密场景。考虑到是真实世界的评估,而不仅仅是课本理论。这会成为衡量AI在加密领域能力的标准吗?行业正在密切关注。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 6
  • 转发
  • 分享
评论
0/400
shadowy_supercodervip
· 12-11 14:38
ngl cryptobench听起来有点太理想化了,实际跑起来行不行另说
回复0
QuorumVotervip
· 12-11 10:58
cryptobench听起来唬人但也就那样,真正能解决滑点问题吗? --- 普林斯顿搞的benchmark我信,但这玩意儿能跑赢市场才是硬道理 --- 又一个"革命性"测试...等等结果再说吧 --- llm agent做交易?先别吹,给我看看实盘数据 --- 话题不错,就怕成了另一个营销噱头
回复0
区块考古学家vip
· 12-10 20:10
普林斯顿搞这套CryptoBench还是有点东西的,终于有人敢测AI在币圈的真实战斗力了
回复0
链游韭菜收割机vip
· 12-10 20:06
嘿呀,普林斯顿出手了,这下crypto圈的AI得认真卷起来了 CryptoBench听起来还不错,就是不知道最后能不能真的干掉那些花瓶模型 等等,这玩意儿能测出哪些AI适合撸毛吗...算了想太多 终于有人认真搞这事儿了,别再拿通用模型来糊弄我们 Princeton联动Web3,这组合我喜欢,实战才是检验真理的唯一标准啦
回复0
bridgeOopsvip
· 12-10 19:47
ngl cryptobench听起来挺硬的,终于有人搞实战测试了,不是光吹牛 等等这玩意真能成标准吗,得看后续有没有人跟进啊 哈哈ai进军币圈了,这下子机器人也要学炒币了
回复0
元宇宙资深流浪汉vip
· 12-10 19:41
普林斯顿出手了,这下AI模型们是要真刀真枪干活了,光吹牛逼没用 CryptoBench这东西要真能成标准,得看业内怎么买账,目前还太早说 又是benchmark又是stress test,感觉每周都在造新概念...不过专门针对crypto场景倒是新意 想看看这套评估体系实际跑起来效果咋样,会不会又是论文漂亮实战拉胯
回复0
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)