Anthropic объявила об ограниченном релизе модели Mythos, сопроводив его редким предупреждением: модель слишком опасна для широкого доступа из-за способностей в кибератаках. Это вызвало цепную реакцию — экстренные совещания в банковском секторе США и Великобритании, ответный ход OpenAI с презентацией GPT-5.4-Cyber и решение сервиса cal.com закрыть исходный код, сославшись на новую угрозу. Теперь появились первые сторонние оценки — и картина стала сложнее.
Контекст
Британский AI Security Institute (AISI) — государственная организация, тестирующая модели на задачи информационной безопасности уже три года, — получил прямой доступ к Mythos. Это не анализ «с дивана»: реальные испытания, реальные данные. AISI фиксирует устойчивый и постепенный рост способностей LLM в ИБ. Mythos продолжает этот тренд, но не выбивается из него каким-то аномальным скачком.
На «лёгких» CTF-заданиях модель вписывается в общую картину — там и другие модели уже подбираются к 100%. Интереснее «экспертный» уровень: год назад ни одна модель с такими заданиями вообще не справлялась. Mythos осилил 73% из самого сложного набора — первый результат такого рода среди всех проверенных моделей.
Главный тест — «The Last Ones», симулирующий атаку на корпоративную сеть через 32 последовательных шага. Ранее ни одна модель не проходила его полностью. Mythos стала первой: в 3 попытках из 10 тест был пройден целиком. AISI оговаривается: реальные атаки могут быть сложнее, потому что в тесте отсутствовала часть защитных систем.
Аналитика
Блогер Дрю Брюнинг заметил деталь, которую AISI почти не акцентировал: на каждую попытку пройти «The Last Ones» выделялось 100 миллионов токенов. Причём заметная часть прогресса происходила уже после отметки в 50 млн. Это дорого — и это меняет всю картину угрозы. Mythos мощный, но не дешёвый инструмент.
Брюнинг формулирует прямо: кибербезопасность превращается в гонку кошельков. Хочешь быть защищён — трать на поиск уязвимостей столько, сколько потенциальный атакующий готов потратить на твой взлом. Из этого следует неожиданный вывод: крупные, хорошо финансируемые опенсорсные проекты могут оказаться более защищёнными, чем самодельные «велосипеды» — у них есть ресурс на систематическую ИИ-проверку. Это идёт вразрез с нарративом «опенсорс небезопасен из-за атак на цепочку поставок», который возник после недавних взломов ряда проектов.
Компания Aisle, специализирующаяся на кибербезопасности, добавляет третий угол: задачи ИБ — не монолит. Это набор подзадач, и для многих из них хватает дешёвых моделей. Способности небольших LLM неравномерны, но в отдельных точках они полностью применимы. Итог: Mythos — наиболее мощный инструмент сегодня в этой области, но не замена всей экосистемы. Платить за него там, где справится более доступная модель — нет смысла.
Кейсы применения в бизнесе
B2B-SaaS стартап с небольшой командой: AISI прямо указывает — первыми пострадают слабо защищённые системы. Пора внедрить то, что индустрия давно знает и что большинство стартапов откладывает: MFA везде, принцип минимальных привилегий, автоматический аудит зависимостей, базовый SAST в CI. Это не требует Mythos — это фундамент.
Корпорация с legacy-инфраструктурой: именно здесь концентрируются уязвимости, которые «существуют годами, но оставались незамеченными». Имеет смысл заложить бюджет на периодический AI-assisted пентест с доступными моделями — без Mythos, но регулярно. Брюнинг прав: поиск уязвимостей становится доступнее, но пока — тем, кто целенаправленно вкладывается.
SMB и локальный бизнес в КР/СНГ: реалистичный сценарий — не гнаться за флагманскими моделями, а встроить LLM-проверку кода в процесс каждого релиза. Брюнинг описывает это как новый обязательный этап разработки — «закалка» после ревью. Для небольших команд это доступно уже сегодня с текущим поколением моделей.
Кейсы в личной жизни
Разработчик: добавь в свой workflow этап AI-проверки кода на уязвимости перед каждым PR. Не нужен Mythos — Claude Sonnet или аналог справляется с анализом конкретного файла или функции. Aisle показала: с точечными подзадачами небольшие модели работают вполне.
Фрилансер, сдающий проекты клиентам: добавь пункт «AI security review» в чеклист сдачи. Это одновременно дифференциатор и реальная защита клиента. Стоимость — минимальная, несколько сотен токенов на файл.
Студент или начинающий специалист по ИБ: тренд однозначен — LLM становятся частью инструментария как атаки, так и защиты. Сейчас оптимальное время разобраться, как модели справляются с CTF-задачами, где их предел, где они сильны. Это конкурентное преимущество на рынке труда уже сегодня.
Как применить сегодня
- Проведи честный аудит: какие базовые защитные меры (MFA, минимальные привилегии, обновления зависимостей) реально внедрены, а какие только запланированы.
- Добавь AI-проверку кода в пайплайн — даже доступный уровень Claude Sonnet закроет часть уязвимостей на этапе ревью без бюджета Mythos.
- Оцени стоимость ИИ-пентеста для своего проекта: сколько токенов нужно, чтобы пройтись по ключевым модулям. Это помогает осознать реальный финансовый порог угрозы и своей защиты.
- Следи за опенсорсными моделями: если аналоги Mythos появятся в открытом доступе, стоимость атак резко упадёт — и порог угрозы для всех изменится.
- Не меняй весь инструментарий под одну модель — разбей задачи ИБ на подзадачи и подбирай LLM под каждую отдельно, исходя из реальной стоимости и точности.
