Gate News повідомляє, 19 березня вранці Xiaomi офіційно представила серію AI-моделей MiMo-V2, яка включає флагманську модель для логіки Pro, мультимодальну базу Omni та синтез мовлення TTS.
MiMo-V2-Pro має понад 1 трильйон параметрів (42B активних параметрів), підтримує понад 1 мільйон токенів у довгому контексті, спеціально розроблена для сценаріїв роботи агентів. У рейтингу Artificial Analysis посідає восьме місце у світі та друге в країні, у тестах PinchBench і ClawEval — третє місце у глобальному масштабі. Загальна продуктивність перевищує Claude Sonnet 4.6 і наближається до Opus 4.6, але ціна лише п’ята частина від останнього: $1 за введення та $3 за мільйон токенів у контексті до 256K, $2 за введення та $6 за мільйон токенів у контексті до 1M. Модуль MiMo Claw вже інтегрований у екосистему WebOffice від Kingsoft, а також у WPS Lingxi.
MiMo-V2-Omni — мультимодальна база, що підтримує текст, зображення, аудіо та відео, з довжиною контексту 256K, ціна — $0.4 за введення та $2 за мільйон токенів. У сфері аудіо підтримується обробка понад 10 годин безперервного довгого аудіо, за результатами тестів перевищує Gemini 3 Pro; у розумінні зображень — перевищує Claude Opus 4.6 і наближається до Gemini 3 Pro.
MiMo-V2-TTS базується на власному Audio Tokenizer, пройшов понад мільярд годин попереднього навчання на голосових даних, підтримує багаторівневий контроль від стилю до емоцій, може синтезувати високоякісне спів, включаючи діалекти: північний східний, сичуаньський, хенаньський, кантонський і тайванський.
Три моделі вже інтегровані у Xiaomi miclaw, MiMo Studio, Kingsoft Office та браузер Xiaomi, а також доступні для виклику через п’ять основних фреймворків Agent: OpenClaw, OpenCode, KiloCode, Blackbox і Cline. Пропозиція дійсна безкоштовно протягом тижня.