曼曼公主在小區散步的時候遇見了Dobby,Dobby說 @SentientAGI 搞了一個MindGames Arena ,問曼曼公主要不要參加,曼曼公主回家趕緊研究了一下



這個比賽聽起來像是 AI 的終極真人秀,它們得結盟、忽悠、背叛,還要假裝自己沒在偷偷算計對方!Sentient 拉來了一票學術界和科技界的大腕,普林斯頓、MIT CSAIL、Meta 等等,要給這些 AI 代理來一場燒腦的社會推理大考驗

這場比賽的規則是固定種子、可重現環境,還有嚴格的回合數、消息量、甚至牆鍾時間,讓 AI 們沒法靠框架作弊蒙混過關,還有技能大亂鬥,從隊友你到底藏了啥祕密的合作挑戰,到我賭你不敢背叛我的虛張聲勢,再到來咱們組個聯盟,最後哦不我反悔了!的談判戲碼,MindGames 涵蓋了 AI 在現實世界可能遇到的所有社交尷尬時刻
玩法也是花樣百出,1v1 單挑、團隊混戰、還是全場亂鬥?部分信息還是全知視角?短平快還是馬拉松式博弈?隨便你挑,AI 們得在各種場景下證明自己不是社交小白,不只評分看輸贏,除了誰賺了最多積分MindGames 還會用放大鏡檢查 AI 的嘴炮質量,比如說你撒謊夠不夠高級?說服力夠不夠強?是不是三句不離套路?還有AI 的讀心術準不準?聯盟組了多久就崩了?這些都得量化!
還有壓力測試,AI 在簡單場景裏還能裝模作樣,但一旦時間拉長、對手開始演或者規則突然變卦,它們的計劃就容易崩得像沙雕城堡,MindGames 就是要揪出這些翻車瞬間,讓 AI 開發者直面慘案現場

曼子看了看覺得這不只是場比賽啊,MindGames Arena 就像是 AI 的社會實驗室讓開發者看到自家 AI 在復雜社交場景裏是真聰明,還是只會在簡單任務裏裝大佬,從欺騙到合作從結盟到背後捅刀,這些技能可不只是遊戲裏好玩現實世界的 AI 產品也得學會在人類社會的混亂中立環境裏遊刃有餘

然後我覺得這個比賽我不配,機靈的人類可以去試一下,傳送門:
查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 留言
  • 轉發
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)