Фьючерсы
Доступ к сотням фьючерсов
TradFi
Золото
Одна платформа мировых активов
Опционы
Hot
Торги опционами Vanilla в европейском стиле
Единый счет
Увеличьте эффективность вашего капитала
Демо-торговля
Введение в торговлю фьючерсами
Подготовьтесь к торговле фьючерсами
Фьючерсные события
Получайте награды в событиях
Демо-торговля
Используйте виртуальные средства для торговли без риска
Запуск
CandyDrop
Собирайте конфеты, чтобы заработать аирдропы
Launchpool
Быстрый стейкинг, заработайте потенциальные новые токены
HODLer Airdrop
Удерживайте GT и получайте огромные аирдропы бесплатно
Pre-IPOs
Откройте полный доступ к глобальным IPO акций
Alpha Points
Торгуйте и получайте аирдропы
Фьючерсные баллы
Зарабатывайте баллы и получайте награды аирдропа
Инвестиции
Simple Earn
Зарабатывайте проценты с помощью неиспользуемых токенов
Автоинвест.
Автоинвестиции на регулярной основе.
Бивалютные инвестиции
Доход от волатильности рынка
Мягкий стейкинг
Получайте вознаграждения с помощью гибкого стейкинга
Криптозаймы
0 Fees
Заложите одну криптовалюту, чтобы занять другую
Центр кредитования
Единый центр кредитования
Рекламные акции
AI
Gate AI
Ваш универсальный AI-ассистент для любых задач
Gate AI Bot
Используйте Gate AI прямо в вашем социальном приложении
GateClaw
Gate Синий Лобстер — готов к использованию
Gate for AI Agent
AI-инфраструктура: Gate MCP, Skills и CLI
Gate Skills Hub
Более 10 тыс навыков
От офиса до трейдинга: единая база навыков для эффективного использования ИИ
GateRouter
Умный выбор из более чем 30 моделей ИИ, без дополнительных затрат (0%)
Xiaomi раскрывает детали обучения модели MiMo-V2-Pro объемом 1Т: задействовано тысячи калорий, без ранга и без дедлайна
ME News Новости, 24 апреля (UTC+8), согласно мониторингу 动察 Beating, руководитель команды больших моделей Xiaomi 罗福莉 в первом глубоком интервью раскрыла, что базовая модель MiMo-V2-Pro имеет общее количество параметров 1 триллион, для обучения использовано тысячи GPU. Она считает, что масштаб в 1 триллион — это минимальный уровень для достижения близкого к Claude Opus 4.6 уровня и получения пропуска на следующий этап участия в конкуренции агентов.
На техническом уровне, версия Pro увеличивает соотношение глобального внимания и скользящего окна внимания до 7:1, достигая экстремально разреженного соотношения, что при увеличении количества параметров контролирует вычислительные затраты на обработку длинных текстов, а также использует архитектуру MTP (многотокенное предсказание) для ускорения inference за счет избыточных вычислительных ресурсов.
На управленческом уровне, в команде MiMo из ста человек только тридцать или сорок непосредственно участвуют в ключевых итерациях, команда не устанавливает иерархии должностей, не делит на четкие подгруппы и не имеет жестких сроков сдачи. В случае нестабильных числовых показателей, таких как скачки в loss при обучении, команда предпочитает сразу останавливать обучение для диагностики, даже если это занимает одну-две недели и стоит миллионы вычислительных ресурсов.
(Источник: BlockBeats)