2026-07-03 04:02 · 🤖 AI World

Метод короткого поводка: держи AI-агент под контролем

Год работы в security-критичных системах и один вывод: чем больше автономии у AI-агента, тем хуже код. Разработчик из okTurtles описывает методологию, которая бьёт Fable 5 по качеству — не за счёт более мощной модели, а за счёт контроля.

Разработчик и мейнтейнер security-critical проектов из команды okTurtles опубликовал методологию под названием «короткий поводок» — итог более года практики с AI-агентами. Главный тезис звучит контринтуитивно на фоне нынешнего хайпа: убрать себя из процесса кодирования — это не продуктивность, это потеря качества. Даже Fable 5, последний frontier-релиз от Anthropic, пишет «рабочий, но ужасно неэффективный и уродливый» код без надзора эксперта.

Контекст

YouTube-культура «вайб-инжиниринга» сформировала целый жанр: 12 параллельных агентов под управлением оркестратора, разработчик сидит с кофе, AI пишет сам. Автор статьи прямо называет результат — slop: код, который формально работает, но никто не понимает, включая того, кто его «написал». В security-critical системах это не просто технический долг — это прямой путь к уязвимостям.

Автор создал собственный форк AI-агента Crush и собственные инструменты AI-ревью, которые по его словам работают на уровне коммерческих многомиллиардных систем. Его аудитория — не джуниоры и не случайные пользователи, а эксперты, которые разбираются в своей предметной области лучше любой языковой модели. Именно им нужна методология, которая ускоряет работу без деградации качества.

Важный нюанс: проблема усиливается в нишевых областях с малым количеством обучающих данных. Frontier-модели теряют уверенность именно там, где эксперту нужна наибольшая точность. Маркетинговые заявления о «мышлении за пределами обучающих данных» автор прямо называет неправдой.

Аналитика

Метод короткого поводка — это не антипозиция к AI, а конкретная точка на шкале автономии. Вместо устранения разработчика из петли — его максимальное присутствие: читать каждый diff в permissions-промпте, отклонять сомнительные изменения, делать git commit после каждого подзадачи. Последнее — не формальность. Автор документирует реальное поведение: модели (включая Opus) иногда удаляют ранее готовую работу. Без истории коммитов это катастрофа, с ней — minor setback.

Отдельный паттерн — гибридное code review. AI работает как линтер: быстро ловит типичные ошибки, опечатки, нарушения стилей. Человек — как архитектор: видит направленческие отклонения, которые модель не замечает. Комбинация стабильно даёт меньше ошибок, чем любой из участников по отдельности.

Идея AI Disclosure в описании PR — простая, но почти нигде не принятая: явно указывать, какая модель использовалась и в каком режиме. Это создаёт доверие внутри команды, позволяет мейнтейнерам предлагать более сильные модели и формирует культуру прозрачности вокруг AI-assisted разработки. Ранние адоптеры этой практики получают репутационное преимущество сейчас, пока норма ещё не сложилась.

Кейсы применения в бизнесе

B2B-SaaS стартап с командой 2-3 разработчиков: YOLO-режим здесь особенно опасен — технический долг накапливается незаметно, и через квартал никто не понимает собственную кодовую базу. Short leash: планирование задачи → агент пишет → разработчик читает diff → коммит → следующий подзадача. Скорость AI сохраняется, но качество остаётся поддерживаемым. Это важно, если планируется привлечение внешних разработчиков или продажа бизнеса — новые люди должны суметь разобраться в коде.

Корпорация с legacy-системами: в enterprise security и compliance стоят на первом месте. Отпустить AI в legacy-кодовую базу без надзора — прямой путь к регрессии и уязвимостям. Метод поводка здесь: критичные секции помечаются как no-touch, AI используется для рутинных задач под жёстким контролем, каждый PR проходит двойное ревью — модель плюс человек.

SMB и локальный бизнес в КР/СНГ: небольшие компании часто работают с одним разработчиком или фрилансером. Если он использует AI в режиме полной автономии, владелец бизнеса получает код, который не понимает никто — включая разработчика. AI Disclosure в коммитах и обязательное чтение diff даёт минимальную трассируемость: что именно было сделано и почему.

Кейсы в личной жизни

Разработчик-одиночка или фрилансер: pet project или клиентский заказ — в обоих случаях короткий поводок защищает от ситуации «я написал 2000 строк за неделю и теперь не понимаю, что там». Читать каждый diff — это не тормоз, это страховка от катастрофы через два месяца.

Студент или джуниор: для тех, кто учится, это единственный приемлемый режим работы с AI. Наблюдать за diff и разбираться, что делает модель — это обучение. Принять слепо — деградация навыков. Короткий поводок превращает AI в принудительный code review с объяснением.

Контент-мейкер, который строит публично: если ты показываешь процесс разработки аудитории, объяснимость кода имеет прямую ценность. Публика замечает, понимаешь ли ты сделанное. Модель поводка делает контент честным — и это сейчас дефицит на фоне волны YOLO-стримов.

«AI-assisted PRs — это по сути PRs от AI с помощью человека. Поэтому человек, который отправляет PR, должен понимать, что отправляет. Он должен проверить свой же PR как чужой — строчка за строчкой.»

Как применить сегодня

Включи режим просмотра diff в своём AI-агенте и никогда не отключай его — в Claude Code это стандартное поведение, не обходи его флагом --dangerously-skip-permissions.
Раздели задачу на подзадачи и делай git commit после каждой — не в конце дня, а после каждого логического шага.
Отклоняй изменения в diff сразу, как только видишь что-то подозрительное — не думай «потом разберусь».
В описание каждого PR добавь раздел AI Disclosure: какая модель, в каком режиме, какие части написаны AI, какие вручную.
Перед финальным merge прочитай весь diff самостоятельно — как будто ревьюишь чужой код. Только после этого ставь approve.

#AI-агенты #code review #методология #Claude Code #вайб-кодинг

← Все статьи