В апреле 2026 года Mozilla опубликовала подробности масштабного эксперимента: агентный харнесс на базе Claude Mythos Preview помог найти и исправить 271 уязвимость в Firefox 150. Всего за месяц команда закрыла 423 security-бага. Среди найденного — 15- и 20-летние дыры, которые годами не замечал фаззинг.
Контекст
Mozilla давно ведёт масштабные работы по безопасности Firefox: многолетний фаззинг, ручной анализ кода, программа bug bounty. Браузерный движок — один из сложнейших объектов для аудита: JIT-компилятор, многопроцессная sandbox-архитектура, WebAssembly GC, десятки legacy-подсистем вроде XSLT. Часть найденных багов копилась больше двух десятилетий.
Ранние попытки применить LLM для поиска уязвимостей — с GPT-4 и Claude Sonnet 3.5 — тонули в ложных срабатываниях. Проблема асимметрична: сгенерировать правдоподобный, но ошибочный отчёт дёшево, а разобраться в нём — дорого. Ситуация изменилась, когда появились агентные харнессы: системы, которые не просто анализируют код, но создают и запускают воспроизводимые тест-кейсы для динамической проверки гипотез.
Команда Anthropic передала Mozilla первый набор проблем напрямую ещё в феврале 2026 года — это 3 CVE, атрибутированных Frontier Red Team. Дальше Mozilla построила собственный харнесс поверх существующей инфраструктуры фаззинга, начав с Claude Opus 4.6 для поиска sandbox escape. Когда стал доступен Claude Mythos Preview — просто переключили модель в пайплайне.
Аналитика
Самое показательное — не сами цифры, а тип найденных уязвимостей. Use-after-free через сложную оркестровку event loop и сборщика мусора; sandbox escape через IPC-манипуляции с refcount'ами; переполнение 16-битного bitfield через специальную семантику rowspan=0 — то, что годами не замечал фаззинг. Это не статический анализ. Это рассуждение о семантике кода на нескольких уровнях одновременно.
«Любой разработчик ПО уже сегодня может запустить харнесс с современной моделью для поиска багов и укрепления своего кода. Рекомендуем начать прямо сейчас.» — Mozilla Security Team
Фаззинг хорош для нахождения краш-ситуаций в «горячем» коде. Он слеп к логическим багам, требующим понимания намерения кода, и к уязвимостям в редко вызываемых путях. Агентный подход атакует другую поверхность — и по результатам явно дополняет, а не заменяет традиционные методы. Из 271 закрытого бага: 180 — sec-high, 80 — sec-moderate, 11 — sec-low.
Важно и то, что модели не нашли. Несколько векторов через prototype pollution в parent process, которые раньше успешно эксплуатировались, теперь заблокированы архитектурным решением — заморозкой прототипов по умолчанию. Пайплайн снова и снова бился об эту стену. Это прямая, наблюдаемая верификация того, что прошлые security-решения работают.
Кейсы применения в бизнесе
B2B-SaaS стартап: если есть FastAPI или Node.js бэкенд с накопленным кодом — запустить агентный харнесс на уязвимые подсистемы: авторизация, обработка файлов, парсинг входных данных. Стартовый промпт: «в этом файле может быть баг — найди его и построй тест-кейс». Результат: закрытые уязвимости до того, как их найдут снаружи.
Корпорация с legacy: в любом большом проекте есть модули, в которые никто не заглядывал годами. Именно там живут «20-летние баги» типа XSLT-уязвимости из примера Mozilla. Интеграция AI-сканирования в CI/CD для проверки патчей при merge — следующий логичный шаг, который Mozilla уже анонсировала. Каждый PR проходит автоматический security-аудит.
IT-студия или аутсорс в КР/СНГ: security audit как дополнительная услуга клиентам. Запустить харнесс на клиентский код, предоставить отчёт с воспроизводимыми тест-кейсами — конкретная ценность. Затраты — в основном время на настройку пайплайна и стоимость токенов.
Кейсы в личной жизни
Разработчик: возьми самый сложный модуль своего кода — тот, где сам не уверен в обработке крайних случаев. Запусти Claude с промптом «найди потенциальный баг и напиши воспроизводящий тест». Быстрее и точнее, чем писать тесты вручную вслепую.
Студент или джун: прочитай один из описанных в статье отчётов о реальных уязвимостях. Это лучший учебник по тому, как работают memory corruption bugs, sandbox escapes, race conditions. Понять, как 15-летний баг прятался в браузере, — значит сразу перейти на другой уровень понимания безопасности.
Фрилансер: добавь в предложение услуг AI-assisted security review. Прогони код клиента через агентный анализ перед сдачей. Найдёшь что-нибудь — повод обсудить доработку и дополнительный счёт. Не найдёшь — у тебя есть документация, что проверка проведена.
Как применить сегодня
- Начни с простого: передай Claude фрагмент кода с формулировкой «в этом фрагменте есть потенциальный баг — найди его и напиши минимальный воспроизводящий тест-кейс». Это базовый inner loop харнесса Mozilla.
- Фокусируй на высокорисковых подсистемах: парсинг входных данных, работа с памятью, IPC, авторизация, десериализация.
- Строй пайплайн итеративно: сначала manual run → наблюдение → итерация промптов → параллелизация на несколько файлов → интеграция в CI.
- Дедуплицируй результаты против известных issues в репозитории — иначе потонешь в дублях.
- Обновляй модель по мере выхода новых версий: по опыту Mozilla, замена модели в готовом пайплайне тривиальна и сразу повышает качество всей системы.