Исследовательская команда ServiceNow представила новую модель Apriel-1.6-15B-Thinker — настоящий монстр: при размере в 15B параметров она показывает результаты на уровне аналогов, а объём модели уменьшен сразу в 15 раз. Ещё интереснее, что 15% предобучающих данных обрабатываются с помощью решений NVIDIA, что делает этот подход к оптимизации вычислительных ресурсов особенно примечательным.



Если удастся успешно реализовать концепцию высокопроизводительных малых моделей, это может серьёзно повлиять на расстановку сил на рынке ИИ-вычислений. Ведь сейчас все тратят огромные средства на увеличение числа параметров, а решения, позволяющие делать ту же работу с меньшими ресурсами, точно будут пользоваться спросом.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 5
  • Репост
  • Поделиться
комментарий
0/400
ShibaMillionairen'tvip
· 17ч назад
Сжатие объёма в 15 раз? Если это действительно сможет стабильно работать, стоимость вычислительных мощностей сразу уполовинится.
Посмотреть ОригиналОтветить0
AirdropHunterXMvip
· 17ч назад
15B уже может конкурировать с большими моделями? Если действительно сможет стабильно выдавать результаты, стоимость вычислительных мощностей сразу сократится вдвое.
Посмотреть ОригиналОтветить0
wagmi_eventuallyvip
· 17ч назад
Можно добиться результата всего лишь с 15B — вот это правильный путь, наконец-то кто-то не просто наращивает параметры.
Посмотреть ОригиналОтветить0
GweiWatchervip
· 18ч назад
Черт возьми, 15-кратное уменьшение объема при сохранении того же эффекта — если это действительно реализуют, производители GPU будут в ужасе.
Посмотреть ОригиналОтветить0
WhaleWatchervip
· 18ч назад
Уменьшить объем в 15 раз и всё ещё работать — вот это настоящее мастерство, куда лучше, чем все эти бесполезные модели с сотнями миллиардов параметров.
Посмотреть ОригиналОтветить0
  • Закрепить