親愛的廣場用戶們,廣場使用界面全新升級啦!新版本界面更清新簡潔、操作更流暢絲滑,還有多項貼心新功能上線,快來更新體驗吧!你對新版界面有什麼感受?你最喜歡的新功能是哪一個?你發現了哪些驚喜或變化呢?發帖分享新版廣場使用體驗,瓜分 $10 分享獎勵!
🎁 我們將精選 10 位幸運用戶,每人獎勵 $10 合約體驗券!
參與方式:
1⃣️ 關注 Gate廣場_Official;
2⃣️ 帶上 #我的广场升级体验 標籤發帖,分享你的使用感受,比如界面風格體驗、細節功能變化、你最喜歡的新功能,或優化建議等;
3⃣️ 帖子內容需至少 30 字,並且只帶本活動標籤;
廣場界面煥新介紹文章:https://gate.com/post?post_id=14774358&tim=ARAbClhcBQNwWRIVGAoGBB5QX1sO0O0O&ref=BFlBUFwL&ref_type=105
活動截止時間:2025/10/26 18:00(UTC+8)
你的體驗是我們持續優化的動力!趕快參與和大家分享吧!
蘋果研究人員:主流AI模型仍無法達到AGI期望推理水平
Gate News bot 消息,蘋果研究人員在 6 月份發表的一篇名爲《思考的幻覺》的論文中指出,領先的人工智能 (AGI) 模型在推理方面仍存在困難,因此,開發通用人工智能 (AGI) 的競賽仍任重道遠。
文章指出,主流人工智能大型語言模型 (LLM)(例如 OpenAI 的 ChatGPT 和 Anthropic 的 Claude)的最新更新已包含大型推理模型 (LRM),但其基本功能、擴展特性和局限性“仍未得到充分理解”。
目前的評估主要側重於既定的數學和編碼基準,“強調最終答案的準確性”。然而,研究人員表示,這項評估並未深入了解人工智能模型的推理能力,與通用人工智能僅需幾年就能實現的預期形成了鮮明對比。
研究人員設計了不同的益智遊戲,以超越標準數學基準來測試克勞德·桑奈(Claude Sonnet)、OpenAI 的 o3-mini 和 o1 以及 DeepSeek-R1 和 V3 聊天機器人的“思考”和“非思考”變體。
他們發現,“前沿的邏輯推理模型(LRM)在超過一定復雜度時會面臨準確率的徹底崩潰”,無法有效地泛化推理,而且其優勢會隨着復雜度的上升而消失,這與人們對通用人工智能(AGI)能力的預期相反。
消息來源:Cointelegraph