Всередині Claude Opus 4.7: нова модель Anthropic підвищує планку для автономної розробки програмного забезпечення

Коротко

Anthropic випустила Claude Opus 4.7, що покращує інженерію програмного забезпечення, мультимодальне мислення, обробку довгого контексту та точність інструкцій для складних, довготривалих завдань штучного інтелекту у корпоративних робочих процесах.

Inside Claude Opus 4.7: Anthropic’s New Model Raises The Bar For Autonomous Software EngineeringКомпанія з досліджень і безпеки штучного інтелекту Anthropic випустила Claude Opus 4.7 — нову модель, яка є поступовим, але значним оновленням порівняно з Opus 4.6, з особливим акцентом на покращення у складних завданнях з розробки програмного забезпечення та виконанні складних задач. Модель розроблена для більш стабільної роботи з довготривалими та технічно складними робочими процесами, з більшою точністю дотримання інструкцій та покращеною внутрішньою перевіркою результатів перед формуванням відповіді.

За словами компанії, Opus 4.7 демонструє кращу продуктивність у сценаріях, що включають складні задачі з кодування, де попередні версії часто потребували більшої людської уваги. Модель описується як більш здатна підтримувати строгість у довгих ланцюгах розв’язання проблем, з меншим схилом до пропуску або неправильного тлумачення багатоступеневих інструкцій. У практичних випадках вона має підтримувати більш автономне виконання складних інженерних завдань, таких як налагодження, проектування систем і структуроване генерування коду.

Представлення розширених можливостей у мультимодальній та довгостроковій обробці контексту

Ключовим покращенням у релізі є підвищена мультимодальна здатність моделі, зокрема у візуальному розумінні. Opus 4.7 здатна обробляти зображення з вищою роздільною здатністю порівняно з попередніми версіями, що дозволяє більш детально інтерпретувати складні візуальні входи, такі як щільні скріншоти, технічні діаграми та інтерфейси дизайну. Це оновлення орієнтоване на застосування, що вимагають піксельної точності, зокрема аналіз інтерфейсів та автоматичне витягування документів.

Anthropic також відзначила покращення якості вихідних даних для професійних і творчих завдань. Згідно з повідомленнями, модель генерує більш структуровані презентації, чіткішу документацію та покращені дизайни інтерфейсів у контексті підвищення продуктивності. Ці зміни розглядаються як частина ширшої стратегії підвищення корисності у реальних корпоративних середовищах, а не лише у тестових бенчмарках.

Система також пройшла тестування у сферах, що вимагають довгого контексту та збереження пам’яті. Opus 4.7 краще підтримує збереження файлів з контекстною інформацією протягом тривалих сесій, що дозволяє відновлювати складні робочі процеси з меншими потребами у повторному введенні фонових даних. Це має сприяти багатосесійній розробці та аналітичним задачам, де важлива безперервність.

Поряд із оновленнями продуктивності, Anthropic наголосила на безпеці та контролі розгортання можливостей. Модель оснащена засобами захисту, що мають виявляти та блокувати високоризикові або заборонені запити, пов’язані з кібербезпекою. Компанія зазначила, що цей реліз є частиною ширшого дослідницького підходу, за яким менш просунуті системи використовуються для тестування механізмів безпеки перед застосуванням їх до більш потужних моделей. Хоча загальна безпекова продуктивність цілеспрямовано обмежена у порівнянні з більш просунутими внутрішніми системами, модель все ж доступна для легітимних застосувань у сфері безпеки через структуровану програму перевірки.

Результати оцінки, оприлюднені компанією, свідчать, що Opus 4.7 зберігає переважно схожий профіль безпеки з попередником, з покращеннями у таких сферах, як опір ін’єкціям команд та зменшення обманної поведінки, а також незначними регресами у сферах, що вимагають надмірної деталізації чутливих інструкцій. Загальні оцінки відповідності характеризують модель як здатну бути досить надійною, хоча й не ідеальною у крайніх випадках.

Реліз також вводить зміни у операційний контроль та інструменти для розробників. Додано новий проміжний режим налаштувань для більш точного балансування між якістю відповіді та затримкою. Додаткові функції платформи включають розширену підтримку роздільної здатності зображень, інструменти управління використанням токенів та оновлені команди робочих процесів для покращення процесів рецензування коду та виконання завдань агентами.

Opus 4.7 розгорнута у продуктах Anthropic та зовнішніх провайдерах інфраструктури, з цінами, що залишилися на рівні попередніх версій. Міграційні особливості включають зміни у поведінці токенізації та збільшення обсягу вихідних даних у режимах з високими зусиллями, що може вплинути на інтеграцію у виробничі системи, але розглядається як компроміс для підвищеної надійності розуміння.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити