Незрелый ИИ Anthropic обнаружил уязвимости Linux и OpenBSD, пропущенные людьми десятилетиями – Новости Биткоина

AsiaTokenFund · 2026-04-10T13:09:23+00:00

Ключевые выводы:Предварительный просмотр Claude Mythos от Anthropic набрал 83,1% на Cybergym, обнаружив тысячи уязвимостей нулевого дня во всех основных ОС и браузерах.Проект Glasswing был запущен 7 апреля 2026 года с 11 учредительными партнерами и до $100 миллионов кредитов на использование Mythos для защитников.27-летний OpenBSD

AsiaTokenFund

2026-04-10 13:09:23

Ключевые выводы:

Предварительный просмотр Anthropic’s Claude Mythos набрал 83,1% на Cybergym, обнаружив тысячи нулевых дней на всех основных ОС и браузерах.
Проект Glasswing стартовал 7 апреля 2026 года с 11 учредительными партнерами и до $100 миллионов кредитов на использование Mythos для защитников.
Уязвимость OpenBSD 27-летней давности и баг FFmpeg 16-летней давности пережили миллионы автоматизированных тестов, пока Mythos не обнаружил их за несколько часов.

Claude Mythos AI набрал 83% на Cybergym и обнаружил критические уязвимости во всех основных браузерах и ОС

Модель, которую Anthropic описывает как крупнейшее достижение в области возможностей единой модели в истории передовых ИИ, завершила обучение и была объявлена публично 7 апреля 2026 года после того, как внутренние детали просочились в конце марта через неправильно настроенную систему управления контентом, которая раскрыла примерно 3000 внутренних файлов.

Anthropic не выпускает предварительный просмотр Claude Mythos для широкой публики или через свой общий API. Компания ограничила доступ проверенной группой партнеров после того, как модель продемонстрировала способность обнаруживать и эксплуатировать неизвестные программные уязвимости с скоростью и масштабом, превосходящими как человеческих экспертов, так и предыдущие системы ИИ.

На тестах по кибербезопасности разрыв между Mythos и Claude Opus 4.6 трудно игнорировать. Mythos набрал 83,1% на Cybergym против 66,6% у Opus 4.6, и 93,9% против 80,8% на SWE-bench Verified. На SWE-bench Pro он показал 77,8% против 53,4% — разрыв в 24 пункта. В Humanity’s Last Exam без инструментов он достиг 56,8%, тогда как его предшественник — 40,0%.

Модель не нуждается в специальной подготовке по кибербезопасности для обнаружения этих уязвимостей. Ее успехи обусловлены более широкими достижениями в области логического мышления, многошагового планирования и автономного поведения агента. Получив целевой код в изолированном контейнере, она читает исходный код, формирует гипотезы о недостатках безопасности памяти, компилирует и запускает программное обеспечение, использует отладчики вроде Address Sanitizer, ранжирует файлы по вероятности уязвимости и создает проверенные отчеты об уязвимостях с рабочими доказательствами концепции и эксплойтами.

Некоторые из этих эксплойтов требовали почти никакого человеческого руководства. Tomshardware.com сообщает, что 27-летняя уязвимость OpenBSD TCP SACK, тонкий переполнение целого числа, позволяющее злоумышленнику удаленно вызвать сбой любого отвечающего хоста, создав вредоносные пакеты, была обнаружена автономно после примерно 1000 запусков при общей стоимости менее $20,000. Уязвимость FFmpeg H.264 16-летней давности пережила более пяти миллионов автоматизированных тестов и несколько аудитов, прежде чем Mythos обнаружил ее.

Особое внимание привлекли результаты по браузерам. В тестировании JavaScript-движка Firefox 147 Mythos создал 181 полный эксплойт оболочки и 29 случаев контроля регистров. Claude Opus 4.6 создал два эксплойта оболочки в том же наборе тестов. Модель также построила рабочие цепочки повышения привилегий ядра Linux, получение прав пользователя до root на серверах, после фильтрации 100 последних CVE до 40 эксплуатируемых кандидатов и успешного использования более половины из них.

Человеческие валидаторы проверили 198 отчетов о уязвимостях модели и согласились с ее оценками степени серьезности в 89% случаев, при 98% согласия в пределах одного уровня серьезности.

Проект Glasswing

Пока что полностью исправлены менее 1% обнаруженных уязвимостей. Anthropic координирует ответственное раскрытие, публикует криптографические SHA-3-коммиты для неисправленных проблем и придерживается графика в 90+45 дней до полного раскрытия деталей. Уязвимость удаленного выполнения кода на сервере FreeBSD NFS, CVE-2026-4747, возрастом 17 лет, предоставляющая полный неаутентифицированный доступ root, уже включена в раскрытие.

Проект Glasswing, анонсированный вместе с моделью, — это попытка Anthropic направить эти возможности на защиту до того, как подобные инструменты станут широко доступны. Среди учредительных партнеров — Amazon Web Services, Apple, Broadcom, Cisco, Crowdstrike, Google, JPMorganChase, Linux Foundation, Microsoft, Nvidia и Palo Alto Networks. Доступ расширяется более чем для 40 других критически важных организаций программного обеспечения.

Anthropic выделила $4 миллионов на донаты в области открытого исходного кода для безопасности: 2,5 миллиона долларов в Alpha-Omega через OpenSSF при поддержке Linux Foundation и 1,5 миллиона долларов в Apache Software Foundation.

Компания признала, что такие ИИ-инструменты, как Mythos, снижают барьер для поиска и эксплуатации уязвимостей, и предупредила о краткосрочных рисках со стороны государственных акторов, Китая, Ирана, Северной Кореи и России, а также преступных группировок, если подобные возможности распространится без контроля. Она описала период переходных потрясений, пока защитники полностью не интегрируют технологию.

Anthropic заявила, что будущие релизы Claude Opus будут включать меры по обнаружению и блокировке опасных кибербезопасных выходных данных, а также планируют ввести программу Cyber Verification для проверенных специалистов по безопасности. Ожидается, что в течение 90 дней будет опубликован публичный отчет о находках партнеров и исправленных уязвимостях.

BTC0,45%

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .