Crypto vừa trải qua bài kiểm tra căng thẳng AI cấp độ chuyên gia đầu tiên. Một công ty AI Web3 hợp tác với Phòng thí nghiệm AI của Princeton để ra mắt CryptoBench— về cơ bản là một chuẩn đánh giá động được xây dựng để xem các Trợ lý LLM thực sự hoạt động như thế nào trong thế giới tiền điện tử đầy thử thách. Giáo sư Mengdi Wang và nghiên cứu sinh tiến sĩ Jiacheng Gu cùng phát triển công cụ này, và nó được thiết kế để đẩy các mô hình AI vượt ra ngoài các nhiệm vụ chung chung thành các tình huống đặc thù trong lĩnh vực crypto. Nghĩ đến việc đánh giá trong thế giới thực, không chỉ lý thuyết trong sách giáo khoa. Liệu điều này có thể trở thành tiêu chuẩn để đo lường khả năng crypto của AI không? Ngành công nghiệp đang theo dõi.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 6
  • Đăng lại
  • Retweed
Bình luận
0/400
shadowy_supercodervip
· 12-11 14:38
ngl cryptobench nghe có vẻ hơi quá lý tưởng hóa, thực tế chạy có được không còn bàn.
Xem bản gốcTrả lời0
QuorumVotervip
· 12-11 10:58
cryptobench nghe có vẻ hoành tráng nhưng cũng chỉ vậy thôi, liệu có thực sự giải quyết được vấn đề trượt giá không? --- Benchmark do Princeton thực hiện tôi tin, nhưng cái này chỉ thật sự có thể thắng thị trường mới là điều quan trọng --- Thêm một "cuộc thử nghiệm mang tính cách mạng"... chờ kết quả rồi hãy nói --- llm agent giao dịch? Chưa vội khen, hãy cho tôi xem dữ liệu thực tế --- Chủ đề hay đấy, chỉ sợ nó trở thành một chiêu trò marketing khác
Xem bản gốcTrả lời0
BlockchainArchaeologistvip
· 12-10 20:10
Princeton đã phát triển bộ CryptoBench này, cuối cùng cũng có người dám thử nghiệm sức mạnh chiến đấu thực sự của AI trong thế giới tiền điện tử.
Xem bản gốcTrả lời0
GamefiHarvestervip
· 12-10 20:06
嘿呀,普林斯顿出手了,这下crypto圈的AI得认真卷起来了 CryptoBench nghe có vẻ khá ổn, chỉ là không biết cuối cùng có thể thực sự loại bỏ những mô hình hoa mỹ đó không Chờ đã, cái này có thể đo được loại AI nào phù hợp để "làm mướn" không... Thôi, nghĩ nhiều quá rồi Cuối cùng có người nghiêm túc làm chuyện này, đừng nữa dùng các mô hình chung chung để lừa dối chúng ta Princeton liên kết với Web3, sự kết hợp này tôi thích, thực chiến mới là tiêu chuẩn duy nhất để kiểm nghiệm đúng sai
Xem bản gốcTrả lời0
bridgeOopsvip
· 12-10 19:47
ngl cryptobench nghe có vẻ khá chất lượng, cuối cùng cũng có người làm thử nghiệm thực tế rồi, không chỉ nói xuông Chờ xem liệu thứ này có thể trở thành tiêu chuẩn không, còn phụ thuộc vào việc có người theo kịp hay không Haha AI đã tiến vào thị trường tiền điện tử rồi, lần này robot cũng phải học cách đầu tư coin luôn rồi
Xem bản gốcTrả lời0
MetaverseVagrantvip
· 12-10 19:41
普林斯顿出手了,这下AI模型们是要真刀真枪干活了,光吹牛逼没用 CryptoBench这东西要真能成标准,得看业内怎么买账,目前还太早说 又是benchmark又是stress test,感觉每周都在造新概念...不过专门针对crypto场景倒是新意 想看看这套评估体系实际跑起来效果咋样,会不会又是论文漂亮实战拉胯
Trả lời0
  • Ghim