2026-04-22 14:04 · 🌐 СНГ (tech/AI)

Mythos от Anthropic: разбираем хайп с цифрами на руках

Anthropic выпустила Mythos с редким по откровенности предупреждением: модель опасна из-за хакерских способностей. Три независимых разбора — от британского AI Security Institute, блогера Дрю Брюнинга и компании Aisle — дают куда менее однозначную картину, чем сам Anthropic.

Anthropic объявила об ограниченном релизе модели Mythos, сопроводив его редким предупреждением: модель слишком опасна для широкого доступа из-за способностей в кибератаках. Это вызвало цепную реакцию — экстренные совещания в банковском секторе США и Великобритании, ответный ход OpenAI с презентацией GPT-5.4-Cyber и решение сервиса cal.com закрыть исходный код, сославшись на новую угрозу. Теперь появились первые сторонние оценки — и картина стала сложнее.

Контекст

Британский AI Security Institute (AISI) — государственная организация, тестирующая модели на задачи информационной безопасности уже три года, — получил прямой доступ к Mythos. Это не анализ «с дивана»: реальные испытания, реальные данные. AISI фиксирует устойчивый и постепенный рост способностей LLM в ИБ. Mythos продолжает этот тренд, но не выбивается из него каким-то аномальным скачком.

На «лёгких» CTF-заданиях модель вписывается в общую картину — там и другие модели уже подбираются к 100%. Интереснее «экспертный» уровень: год назад ни одна модель с такими заданиями вообще не справлялась. Mythos осилил 73% из самого сложного набора — первый результат такого рода среди всех проверенных моделей.

Главный тест — «The Last Ones», симулирующий атаку на корпоративную сеть через 32 последовательных шага. Ранее ни одна модель не проходила его полностью. Mythos стала первой: в 3 попытках из 10 тест был пройден целиком. AISI оговаривается: реальные атаки могут быть сложнее, потому что в тесте отсутствовала часть защитных систем.

Аналитика

Блогер Дрю Брюнинг заметил деталь, которую AISI почти не акцентировал: на каждую попытку пройти «The Last Ones» выделялось 100 миллионов токенов. Причём заметная часть прогресса происходила уже после отметки в 50 млн. Это дорого — и это меняет всю картину угрозы. Mythos мощный, но не дешёвый инструмент.

Брюнинг формулирует прямо: кибербезопасность превращается в гонку кошельков. Хочешь быть защищён — трать на поиск уязвимостей столько, сколько потенциальный атакующий готов потратить на твой взлом. Из этого следует неожиданный вывод: крупные, хорошо финансируемые опенсорсные проекты могут оказаться более защищёнными, чем самодельные «велосипеды» — у них есть ресурс на систематическую ИИ-проверку. Это идёт вразрез с нарративом «опенсорс небезопасен из-за атак на цепочку поставок», который возник после недавних взломов ряда проектов.

Компания Aisle, специализирующаяся на кибербезопасности, добавляет третий угол: задачи ИБ — не монолит. Это набор подзадач, и для многих из них хватает дешёвых моделей. Способности небольших LLM неравномерны, но в отдельных точках они полностью применимы. Итог: Mythos — наиболее мощный инструмент сегодня в этой области, но не замена всей экосистемы. Платить за него там, где справится более доступная модель — нет смысла.

Кейсы применения в бизнесе

B2B-SaaS стартап с небольшой командой: AISI прямо указывает — первыми пострадают слабо защищённые системы. Пора внедрить то, что индустрия давно знает и что большинство стартапов откладывает: MFA везде, принцип минимальных привилегий, автоматический аудит зависимостей, базовый SAST в CI. Это не требует Mythos — это фундамент.

Корпорация с legacy-инфраструктурой: именно здесь концентрируются уязвимости, которые «существуют годами, но оставались незамеченными». Имеет смысл заложить бюджет на периодический AI-assisted пентест с доступными моделями — без Mythos, но регулярно. Брюнинг прав: поиск уязвимостей становится доступнее, но пока — тем, кто целенаправленно вкладывается.

SMB и локальный бизнес в КР/СНГ: реалистичный сценарий — не гнаться за флагманскими моделями, а встроить LLM-проверку кода в процесс каждого релиза. Брюнинг описывает это как новый обязательный этап разработки — «закалка» после ревью. Для небольших команд это доступно уже сегодня с текущим поколением моделей.

Кейсы в личной жизни

Разработчик: добавь в свой workflow этап AI-проверки кода на уязвимости перед каждым PR. Не нужен Mythos — Claude Sonnet или аналог справляется с анализом конкретного файла или функции. Aisle показала: с точечными подзадачами небольшие модели работают вполне.

Фрилансер, сдающий проекты клиентам: добавь пункт «AI security review» в чеклист сдачи. Это одновременно дифференциатор и реальная защита клиента. Стоимость — минимальная, несколько сотен токенов на файл.

Студент или начинающий специалист по ИБ: тренд однозначен — LLM становятся частью инструментария как атаки, так и защиты. Сейчас оптимальное время разобраться, как модели справляются с CTF-задачами, где их предел, где они сильны. Это конкурентное преимущество на рынке труда уже сегодня.

Как применить сегодня

Проведи честный аудит: какие базовые защитные меры (MFA, минимальные привилегии, обновления зависимостей) реально внедрены, а какие только запланированы.
Добавь AI-проверку кода в пайплайн — даже доступный уровень Claude Sonnet закроет часть уязвимостей на этапе ревью без бюджета Mythos.
Оцени стоимость ИИ-пентеста для своего проекта: сколько токенов нужно, чтобы пройтись по ключевым модулям. Это помогает осознать реальный финансовый порог угрозы и своей защиты.
Следи за опенсорсными моделями: если аналоги Mythos появятся в открытом доступе, стоимость атак резко упадёт — и порог угрозы для всех изменится.
Не меняй весь инструментарий под одну модель — разбей задачи ИБ на подзадачи и подбирай LLM под каждую отдельно, исходя из реальной стоимости и точности.

#кибербезопасность #Anthropic #LLM #пентест #AI-безопасность

← Все статьи