Xiaomi y MiniMax lanzan simultáneamente sus grandes movimientos, y la guerra de precios de Agent comienza oficialmente

robot
Generación de resúmenes en curso

Título original: Xiaomi y MiniMax lanzan grandes movimientos simultáneamente, la guerra de precios de los Agents ha comenzado oficialmente

Autor original:律动BlockBeats

Fuente original:

Reproducción: Mars Finance

Los días 18 y 19 de marzo, dos empresas chinas lanzaron sus grandes modelos de Agent. La startup de IA nacional MiniMax presentó M2.7, y el equipo de modelos grandes de Xiaomi, MiMo, lanzó V2-Pro. Ambos modelos están en el primer nivel mundial en el benchmark de Agent, pero sus precios de API son 1/21 y 1/8 de Claude Opus 4.6, respectivamente.

Las dos empresas lanzaron sus productos en la misma semana, pero sus estrategias son completamente diferentes. Representan dos caminos tecnológicos distintos, apostando por dos futuros diferentes en la era de los Agents.

La misma prueba, una matrícula de 1/17

Primero, una comparación visual.

Según datos de OpenRouter y las páginas oficiales de precios de las empresas, en base al precio por salida de API (por millón de tokens), MiniMax M2.7 cuesta 1.2 dólares, y MiMo V2-Pro cuesta 3 dólares. Como referencia, el precio de salida de Claude Opus 4.6 es 25 dólares, GPT-5.2 es 14 dólares, y Claude Sonnet 4.6 es 15 dólares.

La diferencia de precios es de varias órdenes de magnitud, pero la diferencia en capacidades no lo es. En SWE-bench Verified (el benchmark más popular actualmente para medir habilidades de ingeniería de código), MiMo V2-Pro obtiene un 78%, Sonnet 4.6 un 79.6%, con una diferencia de menos de dos puntos porcentuales. M2.7 tiene un rendimiento en SWE-Pro de 56.22%, igual que GPT-5.3-Codex. En VIBE-Pro (capacidad de entrega de proyectos de extremo a extremo), M2.7 alcanza un 55.6%, cerca del nivel de Opus 4.6.

El enfoque de esta comparación no es quién es mejor o peor—los sistemas de benchmark de cada empresa no están completamente alineados, por lo que la comparación directa debe hacerse con cautela. El punto clave es la «brecha de precio-rendimiento»: los modelos Agent nacionales ya están en el mismo rango de capacidades, pero en diferentes rangos de precios.

Billones de parámetros vs autoevolución

El precio es solo una apariencia. Ambas empresas han presentado estrategias completamente diferentes.

MiMo V2-Pro sigue la línea de «gran esfuerzo, grandes resultados». Según un anuncio oficial de Xiaomi, V2-Pro tiene más de 1 billón de parámetros en total, con 42B de parámetros activos, y soporta contextos ultra largos de 1 millón de tokens. Su innovación principal es el mecanismo de atención híbrido (Hybrid Attention), que combina atención deslizante (SWA) y atención global (GA) en una proporción de 7:1—su predecesor V2-Flash era 5:1. Esta arquitectura hace que el modelo sea más estable al manejar documentos largos y llamadas a múltiples herramientas en escenarios de Agent. En PinchBench (evaluación de capacidad de llamadas a herramientas de Agent), obtiene un 84%.

M2.7 sigue un camino completamente diferente. Según el blog técnico oficial publicado por MiniMax el 18 de marzo, el número de parámetros de M2.7 no se ha divulgado, pero presenta un mecanismo de «autoevolución» que permite al modelo realizar más de 100 ciclos de optimización autónoma, incluyendo análisis de fallos, planificación de cambios, modificación de su propia arquitectura, evaluación y ciclos repetidos, logrando un aumento del 30% en rendimiento en su conjunto de evaluación interno. En las 22 tareas de alta dificultad de MLE Bench Lite (evaluación de dificultad en competencias de aprendizaje automático), M2.7 obtuvo 9 medallas de oro, 5 de plata y 1 de bronce, con una tasa de medallas promedio del 66.6%.

Desde cinco dimensiones, las dos rutas muestran enfoques completamente diferentes: MiMo V2-Pro destaca en longitud de contexto y capacidades de ingeniería de código, mientras que M2.7 se destaca en automatización de oficina y autoevolución. Según el mismo blog técnico de MiniMax, M2.7 obtiene un ELO de 1495 en GDPval-AA (evaluación de procesamiento de documentos de oficina), liderando modelos de código abierto, y mantiene una tasa de cumplimiento del 97% en la prueba MM-Claw, que cubre más de 40 habilidades complejas.

Cinco meses, cuatro versiones

No solo las rutas tecnológicas son diferentes, sino también los ritmos de iteración.

Según registros públicos, MiniMax lanzó la versión M2 en octubre de 2025 y la M2.7 en marzo de 2026, en cinco meses, con cuatro versiones principales, con un promedio de 49 días entre cada gran lanzamiento. La diferencia entre M2.5 y M2.7 fue solo de unos 30 días.

El ritmo de Xiaomi con MiMo es diferente: en abril de 2025 lanzó MiMo-7B (modelo de inferencia de 7B parámetros de código abierto), en diciembre del mismo año lanzó V2-Flash (con 309B en total), y en marzo de 2026 lanzó V2-Pro (con 1T en total). Cada generación tiene un salto mayor en tamaño de parámetros, pero los intervalos entre versiones son más largos.

MiniMax optó por pasos pequeños y rápidos, con cambios moderados en cada iteración, y su mecanismo de autoevolución está diseñado para «evolución continua». Xiaomi, en cambio, prefiere golpes potentes, con cada versión representando un gran salto en tamaño y arquitectura.

8 días anónimos para dominar OpenRouter

Además de las diferencias en las rutas tecnológicas, la estrategia de lanzamiento de Xiaomi también rompe con la norma de la industria.

Según Reuters, el 11 de marzo apareció en la plataforma de agregación de API más grande del mundo, OpenRouter, un modelo anónimo llamado Hunter Alpha. Sin marca, sin conferencia de prensa, sin blog técnico. Su precio de API es muy bajo, pero su rendimiento sorprendentemente fuerte.

La comunidad empezó a especular sobre su origen. Según Republic World y varios medios tecnológicos, la hipótesis más aceptada es que se trata de DeepSeek V4, ya que el responsable del equipo de MiMo, Luo Fuli, trabajó anteriormente en DeepSeek. La cantidad de llamadas aumentó rápidamente, y durante el período anónimo superó los 1 billón de tokens, alcanzando el primer puesto en la lista semanal de OpenRouter.

El 19 de marzo en la madrugada, Xiaomi reveló: Hunter Alpha es en realidad V2-Pro de MiMo. Según Reuters, tras la revelación, las acciones de Xiaomi en Hong Kong subieron hasta un 5.8%.

Es la primera vez que un gran modelo nacional demuestra su capacidad en una plataforma global mediante una prueba ciega. Sin depender de marca ni publicidad, en solo 8 días logró que los desarrolladores votaran con sus pies.

Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado