深潮 TechFlow のニュース、5 月 09 日、蚂蚁百灵は本日、万億規模のフラッグシップ思考モデル Ring-2.6-1T を発表しました。これは複雑で現実的なタスクシナリオ向けに設計されています。モデルは革新的な調整可能な Reasoning Effort メカニズムを導入し、high と xhigh の二つの推論強度をサポートします。実際のタスク実行型評価では、PinchBench のスコアは 87.6 であり、GPT-5.4x High、Gemini-3.1-Pro high、Claude-Opus-4.7x high を上回っています。高難度推論タスクでは、ARC-agi-V2 のスコアは 77.78 であり、Gemini-3.1-Pro high と Claude-Opus-4.7x high と同じ水準にあります。(金十)
蚂蚁百灵发布万亿级旗舰思考模型 Ring-2.6-1T
深潮 TechFlow のニュース、5 月 09 日、蚂蚁百灵は本日、万億規模のフラッグシップ思考モデル Ring-2.6-1T を発表しました。これは複雑で現実的なタスクシナリオ向けに設計されています。モデルは革新的な調整可能な Reasoning Effort メカニズムを導入し、high と xhigh の二つの推論強度をサポートします。実際のタスク実行型評価では、PinchBench のスコアは 87.6 であり、GPT-5.4x High、Gemini-3.1-Pro high、Claude-Opus-4.7x high を上回っています。高難度推論タスクでは、ARC-agi-V2 のスコアは 77.78 であり、Gemini-3.1-Pro high と Claude-Opus-4.7x high と同じ水準にあります。(金十)