2026-05-14 00:02 · 🌐 СНГ (tech/AI)

Claude Mythos взломал симулятор электростанции — впервые в истории тестов AISI

Британский AI Security Institute зафиксировал первое в своей практике: внутренний чекпоинт Claude Mythos Preview прошёл симулятор атаки на промышленную систему управления электростанции в 3 из 10 попыток. Ни предыдущая версия Mythos, ни GPT-5.5 этого не сделали ни разу.

Британский AI Security Institute (AISI) опубликовал отчёт о темпах роста кибервозможностей у передовых моделей. Новый внутренний чекпоинт Claude Mythos Preview прошёл полигон Cooling Tower — симулятор атаки на промышленную систему управления (ICS) электростанции — в 3 из 10 попыток. До этого ни одна из протестированных моделей задачу не выполнила. Параллельно тот же чекпоинт прошёл 32-шаговую симуляцию взлома корпоративной сети The Last Ones в 6 из 10 попыток — против 3 из 10 у предыдущей версии.

Контекст

AISI — государственный институт при правительстве Великобритании, специализирующийся на безопасности AI-систем. Его кибер-полигоны строятся совместно с реальными игроками рынка: Cooling Tower разработан с Hack The Box и имитирует атаку на ICS-инфраструктуру, The Last Ones — с SpecterOps и моделирует 32-шаговый взлом корпоративной сети. В обоих сценариях предполагается, что начальный доступ к сети уже получен: задача модели — развернуть атаку дальше по цепочке.

По оценке AISI, The Last Ones требует от человека-эксперта около 20 часов работы. Новый Mythos Preview справляется с ней в 6 из 10 случаев. Предыдущий чекпоинт брал 3 из 10, GPT-5.5 — 2 из 10. Успех почти удвоился за несколько месяцев между двумя итерациями одной пре-релизной модели.

AISI отслеживает метрику time horizon — длину задач, которые модель решает с надёжностью 80%. В ноябре 2025 года институт оценивал удвоение этого показателя у передовых моделей в 8 месяцев. К февралю 2026 пересчитал до 4.7 месяца. Mythos Preview и GPT-5.5 выпадают выше линии тренда даже на обновлённом ускоренном графике.

Аналитика

Самое ценное в отчёте — не сам факт взлома симулятора, а то, что AISI открыто признаёт: результаты «существенно превысили даже ускоренный темп» и пока неясно, разовый это выброс или новая базовая линия. Редкая институциональная честность — обычно регуляторы публикуют оценки с запасом консерватизма.

Второй сигнал — насыщение бенчмарков. Когда модели решают слишком большую долю тестового набора, точность оценки их реальных возможностей падает. AISI готовит новые полигоны с активной киберобороной, где атакующему противостоит не пустая сеть, а живая команда защитников. Это качественно иной уровень сложности.

Главный практический вывод — динамика важнее абсолютных значений. Если темп сохранится, промышленная инфраструктура и корпоративные сети окажутся под давлением не в абстрактном будущем, а в горизонте пары лет. Атакующие инструменты на базе LLM дешевеют и улучшаются быстрее, чем большинство SOC-команд успевает адаптироваться.

Кейсы применения в бизнесе

B2B-SaaS стартап: если вы не проводили red team тестирование своей инфраструктуры — время пришло. Сценарии типа The Last Ones (поэтапный взлом корпоративной сети) теперь реализуемы агентными системами с относительно невысоким барьером входа. Найдите security-партнёра для симуляции и закройте очевидные векторы до того, как это сделает злоумышленник с LLM.

Корпорация с legacy-инфраструктурой: промышленные системы управления (ICS/SCADA) — исторически самое слабое звено. Cooling Tower имитирует именно этот класс атак. Аудит OT-сегмента сети и проверка воздушного зазора между IT и OT — не рекомендация на потом, а задача для ближайшего квартала.

SMB и локальный бизнес в КР и СНГ: прямая угроза пока умеренная, но стоимость атак с LLM-автоматизацией снижается. Базовая гигиена: сегментация сети, мониторинг аномалий, двухфакторная аутентификация на всех точках входа. Это уже стандарт, а не опциональная мера.

Кейсы в личной жизни

Разработчик / DevOps: если вы администрируете серверы или CI/CD-пайплайны — изучите основы threat modeling. Понимание того, как LLM-агент проходит 32-шаговую цепочку атаки, даёт конкретное представление о том, что закрывать в первую очередь. Начните с OWASP Top 10 для инфраструктуры.

Контент-мейкер про AI: отчёт AISI — отличный материал для объяснения разницы между «модель умнее» и «модель опаснее». Эти две категории не одно и то же, и аудитория часто их путает. Здесь есть конкретные цифры и сценарии для объяснения.

Студент по кибербезопасности: Hack The Box и SpecterOps — реальные платформы для практики. Понимание методологии AISI и того, как строятся полигоны с активной обороной, — прямая подготовка к работе в red team.

Как применить сегодня

Найдите публичный отчёт AISI — в нём есть графики time horizon и методология. Особенно раздел про насыщение бенчмарков.
Если у вас есть OT/ICS-инфраструктура — поставьте задачу проверить сегментацию IT/OT и обновить политики доступа к промышленным сегментам.
Спросите у своего security-провайдера, есть ли у него сценарии многошагового red team с LLM-ассистентом. Если нет — это уже отставание.
Изучите концепцию active cyber defense: AISI готовит полигоны с живой командой защитников — это следующий стандарт оценки реальных угроз.
Следите за следующим отчётом AISI — он покажет, разовый ли это выброс или новая норма для передовых моделей.

#Claude #кибербезопасность #AISI #ICS #red-teaming

← Все статьи