Внутрішній китайський прорив DeepSeek-V4 щойно відкритий, прямо згенерувавши понад 1 мільйон слів у довгому контексті!


DeepSeek-V4 впроваджує нову механіку уваги та здійснює стиснення по вимірюванню токенів, поєднуючись із DSA розрідженою увагою (DeepSeek Sparse Attention), що зменшує обчислювальні ресурси та споживання відеопам’яті при обробці дуже довгого контексту.
Дані тестування показують, що у оцінюванні Agentic Coding (агентоване програмування) показники V4-Pro вже перевищують популярний у галузі Sonnet 4.5 і наближаються до рівня Opus 4.6 у режимі без роздумів.
З урахуванням різних потреб ринку, DeepSeek застосовує двовекторну стратегію: версія Pro орієнтована на складне логічне мислення та світові знання, тоді як менша за параметрами версія Flash відповідає за надання дуже дешевих API-запитів.
Переглянути оригінал
post-image
post-image
post-image
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити