Project Glasswing — Первый отчёт

Содержание

Наши первые результаты
Open-source ПО
Адаптация к новой фазе кибербезопасности
Поддержка экосистемы
Что дальше

В прошлом месяце мы запустили Project Glasswing — нашу совместную работу по защите наиболее критичного в мире программного обеспечения, прежде чем всё более capable AI-модели могут быть обращены против него.

С тех пор мы и наши примерно 50 партнёров использовали Claude Mythos Preview, чтобы найти более десяти тысяч уязвимостей высокой и критической степени серьёзности в самом системно важном ПО в мире. Раньше прогресс в безопасности ПО был ограничен тем, как быстро мы могли находить новые уязвимости. Теперь он ограничен тем, как быстро мы можем верифицировать, раскрывать и патчить огромное количество уязвимостей, найденных ИИ.

В этом посте мы обсуждаем, что мы узнали об этом критическом вызове для кибербезопасности за первые недели Project Glasswing. Мы фокусируемся на ранних публичных свидетельствах производительности Mythos Preview, на начальных результатах сканирования тысяч open-source проектов, и на том, что этот прогресс означает для защитников сегодня. Мы также рассказываем, чего ожидать от Project Glasswing дальше и как мы думаем о релизе моделей класса Mythos в будущем.

Наши первые результаты

Как мы обсуждаем находки Mythos Preview

В индустрии ПО давно принято раскрывать новые уязвимости через 90 дней после обнаружения (или через 45 дней после выхода патча, если он выпущен раньше). Это даёт пользователям время обновить ПО до того, как уязвимость может быть использована атакующими. Наша собственная политика скоординированного раскрытия уязвимостей следует этому подходу.

Однако это означает, что раскрытые уязвимости — запаздывающий индикатор ускоряющегося фронта кибервозможностей AI-моделей: мы пока не можем детально описать находки наших партнёров с Mythos Preview, не подвергая пользователей риску. Вместо этого мы приводим иллюстративные примеры производительности модели вместе с агрегированной статистикой. Когда патчи для найденных Mythos Preview уязвимостей будут широко распространены, мы предоставим гораздо больше деталей.

Свидетельства от партнёров и внешних тестировщиков

Первоначальные партнёры Project Glasswing создают и поддерживают ПО, фундаментальное для работы интернета и другой критической инфраструктуры. Исправление ошибок в их коде снижает риск для множества других организаций, которые на него полагаются, и в конечном счёте — для миллиардов пользователей.

Через месяц большинство партнёров нашли сотни уязвимостей высокой и критической степени серьёзности в своём ПО. В совокупности они нашли более десяти тысяч.

>10 000

уязвимостей найдено партнёрами

>10×

рост скорости поиска багов

2 000

багов нашёл Cloudflare

400

из них high/critical severity

Некоторые сообщили, что их скорость поиска ошибок увеличилась более чем в десять раз. Например, Cloudflare нашёл 2000 багов (400 из которых высокой или критической серьёзности) в своих критических системах с уровнем ложных срабатываний, который команда Cloudflare считает лучшим, чем у людей-тестировщиков.

Это совпадает с опытом внешних тестировщиков и с недавними независимыми оценками модели:

Институт безопасности ИИ Великобритании сообщает, что Mythos Preview — первая модель, решившая оба их киберполигона (симуляции многошаговых кибератак) от начала до конца.
Mozilla нашла и исправила 271 уязвимость в Firefox 150 при тестировании Mythos Preview — более чем в 10 раз больше, чем они нашли в Firefox 148 с Claude Opus 4.6.
XBOW, независимая платформа безопасности, сообщает, что Mythos Preview — «значительный шаг вперёд по сравнению со всеми существующими моделями» на их бенчмарке веб-эксплойтов, и обеспечивает «абсолютно беспрецедентную точность» в пересчёте на токен.
ExploitBench и ExploitGym, два недавно опубликованных академических бенчмарка для измерения способностей моделей к разработке эксплойтов, показывают Mythos Preview как самого сильного исполнителя.

В целом мы видим, что пропатченное ПО теперь выпускается гораздо быстрее. Последний релиз Palo Alto Networks включал в пять раз больше патчей, чем обычно. Microsoft сообщила, что количество новых патчей будет «продолжать расти ещё некоторое время». А Oracle находит и исправляет уязвимости в несколько раз быстрее, чем раньше.

Кейс из реального мира

В одном из банков-партнёров Glasswing Mythos Preview помог обнаружить и предотвратить мошеннический перевод на $1.5 млн после того, как злоумышленник скомпрометировал email клиента и совершал подставные звонки.

Open-source ПО

Последние несколько месяцев Anthropic использовал Mythos Preview для сканирования более 1000 open-source проектов, которые в совокупности составляют основу интернета — и значительной части нашей собственной инфраструктуры.

6 202

high/critical severity (оценка модели)

23 019

всего уязвимостей (все уровни)

90.6%

true positive rate (подтверждённые)

62.4%

подтверждены как high/critical

1752 из этих уязвимостей высокой/критической степени были тщательно оценены одной из шести независимых исследовательских фирм по безопасности (или, в небольшом числе случаев, нами). Из них 90.6% (1587) подтверждены как истинные срабатывания (true positives), и 62.4% (1094) подтверждены как высокой или критической серьёзности.

Это означает, что даже если Mythos Preview не найдёт больше ни одной уязвимости, при текущих показателях true-positive после триажа он на пути к обнаружению почти 3900 уязвимостей высокой/критической степени в open-source коде — вдобавок к тем, что он нашёл для партнёров Project Glasswing.

Пример: wolfSSL

Один из примеров open-source уязвимости — в wolfSSL, криптографической библиотеке, используемой миллиардами устройств по всему миру. Mythos Preview сконструировал эксплойт, который позволил бы атакующему подделывать сертификаты — например, для размещения фейкового сайта банка. Уязвимости присвоен CVE-2026-5194.

Как уже отмечено, узкое место в исправлении таких багов — человеческая способность триажировать, сообщать, разрабатывать и развёртывать патчи. Сам процесс нахождения стал гораздо проще с Mythos Preview. Мы создали дашборд open-source уязвимостей, который показывает разные этапы процесса раскрытия.

Наш процесс триажа очень трудоёмкий. Сначала мы воспроизводим проблему, найденную Mythos, и переоцениваем её серьёзность. После подтверждения проверяем, не были ли уже выпущены исправления, и пишем детальный отчёт мейнтейнерам ПО. Мы проявляем большую осторожность: помимо обычных сложностей, мейнтейнеры столкнулись с потопом низкокачественных, сгенерированных ИИ баг-репортов. Некоторые попросили нас замедлить темп раскрытий, чтобы у них было время на разработку патчей. (В среднем, баг высокой/критической степени требует двух недель на патч.)

По просьбе мейнтейнеров мы иногда раскрываем баги напрямую, без дополнительной оценки. Мы сообщили о 1129 таких непроверенных багах.

Мы оцениваем, что на данный момент раскрыли мейнтейнерам 530 багов высокой/критической степени. 75 из них уже пропатчены, и 65 получили публичные уведомления.

Адаптация к новой фазе кибербезопасности

Модели с навыками кибербезопасности, подобными Mythos Preview, скоро станут широко доступны. Необходимы более масштабные усилия всей индустрии ПО, чтобы управлять объёмом находок, которые эти модели будут генерировать.

Сейчас между обнаружением уязвимости, созданием патча и его широким развёртыванием часто проходит много времени. Это оставляет значительное окно для атакующих. Модели класса Mythos значительно сокращают время и стоимость поиска и эксплуатации уязвимостей, увеличивая риски от этих задержек. В конечном счёте модели класса Mythos позволят разработчикам создавать гораздо более безопасное ПО, отлавливая баги до деплоя. Но промежуточный период — когда уязвимости быстро находятся, но медленно патчатся — создаёт новые риски.

Что делать сейчас:

Разработчикам ПО: сократить циклы патчей
Сетевым защитникам: сократить время тестирования и развёртывания патчей, использовать MFA, вести комплексное логирование

Инструменты для киберзащиты с публичными AI-моделями

Мы выпустили Claude Security в публичной бете для корпоративных клиентов Claude. За три недели Claude Opus 4.7 использовали для патча более 2100 уязвимостей.

Также запустили Cyber Verification Program, позволяющий специалистам по безопасности легитимно использовать наши модели для исследования уязвимостей, пентеста и red-teaming без некоторых ограничений.

Теперь мы делаем инструменты, которые использовали с Mythos Preview, доступными командам безопасности квалифицированных клиентов по запросу. Включает:

Скиллы (кастомные инструкции для повторяющейся работы)
Обвязку для картирования кодовой базы, запуска сканирующих сабагентов, триажа находок и написания отчётов
Построитель threat-моделей

Cisco также недавно открыла исходники своего Foundry Security Spec.

Поддержка экосистемы

Мы сформировали партнёрство с проектом Alpha-Omega при Open Source Security Foundation для помощи мейнтейнерам в обработке баг-репортов. Также поддерживаем разработку ExploitBench и ExploitGym. Через Claude for Open Source поддерживаем мейнтейнеров и обязуемся сканировать любые open-source пакеты, которые сами используем.

Что дальше

Скорость AI-прогресса означает, что модели, столь же способные как Mythos Preview, скоро будут разработаны многими компаниями. Ни у одной компании (включая Anthropic) пока нет safeguards, достаточно сильных, чтобы предотвратить misuse таких моделей. Поэтому мы пока не выпустили модели класса Mythos публично. Но именно поэтому мы запустили Project Glasswing: если подобная модель будет выпущена без таких safeguards, эксплуатация уязвимого ПО станет радикально дешевле и доступнее почти для кого угодно в мире.

Glasswing даёт системно важным киберзащитникам асимметричное преимущество. Однако остро необходимо, чтобы как можно больше организаций укрепили свою киберзащиту.

Далее мы будем работать с критическими партнёрами — включая правительства США и союзников — чтобы расширить Project Glasswing. И в ближайшем будущем, когда мы разработаем гораздо более сильные safeguards, мы планируем общий релиз моделей класса Mythos.

По ту сторону этих рисков нас ждёт обнадёживающий мир: где важный код защищён гораздо лучше, чем сегодня, и где взломы встречаются гораздо реже. Препятствий много, но мы уверены, что Project Glasswing может помочь нам туда попасть.

Связанные материалы

2028: Два сценария глобального AI-лидерства — Взгляд Anthropic на AI-конкуренцию между США и Китаем
Teaching Claude why — Новое исследование о снижении agentic misalignment
Natural Language Autoencoders — Превращение мыслей Claude в читаемый текст

Project Glasswing: Первый отчёт