2025-12-10 19:40:57

Crypto vừa trải qua bài kiểm tra căng thẳng AI cấp độ chuyên gia đầu tiên. Một công ty AI Web3 hợp tác với Phòng thí nghiệm AI của Princeton để ra mắt CryptoBench— về cơ bản là một chuẩn đánh giá động được xây dựng để xem các Trợ lý LLM thực sự hoạt động như thế nào trong thế giới tiền điện tử đầy thử thách. Giáo sư Mengdi Wang và nghiên cứu sinh tiến sĩ Jiacheng Gu cùng phát triển công cụ này, và nó được thiết kế để đẩy các mô hình AI vượt ra ngoài các nhiệm vụ chung chung thành các tình huống đặc thù trong lĩnh vực crypto. Nghĩ đến việc đánh giá trong thế giới thực, không chỉ lý thuyết trong sách giáo khoa. Liệu điều này có thể trở thành tiêu chuẩn để đo lường khả năng crypto của AI không? Ngành công nghiệp đang theo dõi.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

18 thích

Phần thưởng
18
6
Đăng lại
Retweed

Bình luận

0/400

shadowy_supercoder

· 12-11 14:38

ngl cryptobench nghe có vẻ hơi quá lý tưởng hóa, thực tế chạy có được không còn bàn.

Xem bản gốcTrả lời0

QuorumVoter

· 12-11 10:58

cryptobench nghe có vẻ hoành tráng nhưng cũng chỉ vậy thôi, liệu có thực sự giải quyết được vấn đề trượt giá không? --- Benchmark do Princeton thực hiện tôi tin, nhưng cái này chỉ thật sự có thể thắng thị trường mới là điều quan trọng --- Thêm một "cuộc thử nghiệm mang tính cách mạng"... chờ kết quả rồi hãy nói --- llm agent giao dịch? Chưa vội khen, hãy cho tôi xem dữ liệu thực tế --- Chủ đề hay đấy, chỉ sợ nó trở thành một chiêu trò marketing khác

Xem bản gốcTrả lời0

BlockchainArchaeologist

· 12-10 20:10

Princeton đã phát triển bộ CryptoBench này, cuối cùng cũng có người dám thử nghiệm sức mạnh chiến đấu thực sự của AI trong thế giới tiền điện tử.

Xem bản gốcTrả lời0

GamefiHarvester

· 12-10 20:06

嘿呀，普林斯顿出手了，这下crypto圈的AI得认真卷起来了 CryptoBench nghe có vẻ khá ổn, chỉ là không biết cuối cùng có thể thực sự loại bỏ những mô hình hoa mỹ đó không Chờ đã, cái này có thể đo được loại AI nào phù hợp để "làm mướn" không... Thôi, nghĩ nhiều quá rồi Cuối cùng có người nghiêm túc làm chuyện này, đừng nữa dùng các mô hình chung chung để lừa dối chúng ta Princeton liên kết với Web3, sự kết hợp này tôi thích, thực chiến mới là tiêu chuẩn duy nhất để kiểm nghiệm đúng sai

Xem bản gốcTrả lời0

bridgeOops

· 12-10 19:47

ngl cryptobench nghe có vẻ khá chất lượng, cuối cùng cũng có người làm thử nghiệm thực tế rồi, không chỉ nói xuông Chờ xem liệu thứ này có thể trở thành tiêu chuẩn không, còn phụ thuộc vào việc có người theo kịp hay không Haha AI đã tiến vào thị trường tiền điện tử rồi, lần này robot cũng phải học cách đầu tư coin luôn rồi

Xem bản gốcTrả lời0

MetaverseVagrant

· 12-10 19:41

普林斯顿出手了，这下AI模型们是要真刀真枪干活了，光吹牛逼没用 CryptoBench这东西要真能成标准，得看业内怎么买账，目前还太早说又是benchmark又是stress test，感觉每周都在造新概念...不过专门针对crypto场景倒是新意想看看这套评估体系实际跑起来效果咋样，会不会又是论文漂亮实战拉胯

Trả lời0

Chủ đề thịnh hànhXem thêm
#GateNovTransparencyReportReleased
17.37K Phổ biến
#FedRateCutComing
680.48K Phổ biến
#PostonSquaretoEarn$50
62.96K Phổ biến
#BitcoinActivityPicksUp
17.52K Phổ biến
#CryptoMarketRebound
544.12K Phổ biến

Gate Fun hotXem thêm

1
GWHALEGWhale
Vốn hóa:$3.81KNgười nắm giữ:3
0.97%
2
BGOLDBGOLD
Vốn hóa:$3.67KNgười nắm giữ:1
0.78%
3
HTBGHotBerg
Vốn hóa:$3.7KNgười nắm giữ:2
0.02%
4
GBOYGBOY
Vốn hóa:$3.71KNgười nắm giữ:2
0.04%
5
领袖交易员领袖交易员
Vốn hóa:$3.66KNgười nắm giữ:2
0.09%

Ghim

sơ đồ trang web