2026-05-16 12:01 · 🌐 СНГ (tech/AI)

Обвязка важнее модели: что год с LLM меняет в голове

Инженер из Kaiten год строил harness вокруг Claude и других LLM — и пришёл к неудобному выводу: смена модели даёт ограниченный прирост, а каждый новый слой обвязки вокруг неё — кратный. Разбираем, почему это не хайп, а реальная механика продуктивности.

Команда Kaiten год работает в Claude Code, пробует разных провайдеров и ведёт внутренние метрики качества. Главный итог — не тот, которого ожидали. Смена модели даёт ощутимый, но конечный прирост. Зрелый harness — системный промпт, инструменты, контекст, скиллы, хуки, разрешения и память — умножает этот прирост кратно. Без него даже топовый Claude работает как экскаватор без рычагов.

Контекст

Термин harness (обвязка) в LLM-инженерии — это весь контур, в котором живёт модель. Эдди Османи из Google сформулировал это в апреле 2026-го: Agent = Model + Harness. Его ключевой тезис: зрелая обвязка вокруг средней модели бьёт сырую обвязку вокруг топовой. Независимо его подтвердил Gabriel Chua из OpenAI: Codex-модели обучаются в присутствии harness — tool use, execution loops, итеративная верификация встроены в то, как модель учится работать, а не надстроены сверху.

Структуру harness удобно читать через практический гайд инженера Youngju Kim (март 2026): семь блоков — system-prompt, tools, context, skills, hooks, permissions, memory. Если у вас есть CLAUDE.md, пара slash-команд и pre-commit хуки — у вас уже зрелый harness, просто называется иначе.

Параллельно Anthropic Engineering выпустили две статьи: в сентябре 2025-го про «context rot» — чем больше контекста, тем хуже модель его удерживает, и курировать его надо как конечный ресурс. В октябре — про «progressive disclosure»: метаданные триггерят релевантность скилла, полная документация подгружается только при необходимости. Джереми Ховард из Answer.AI стандартизировал это в формате llms.txt — компактный индекс в корне проекта, который за год поддержали Anthropic, Cursor и масса docs-сайтов.

Аналитика

Почему независимые инженеры из Google, OpenAI, Anthropic, Answer.AI за полгода пришли к одному? Не потому что индустрия «сошлась». Это нормальная фаза взросления любого, кто прошёл с LLM достаточный путь. Глубина использования упирается в потолок предсказуемости — и его модель сама не пробивает. Пробивает обвязка.

Практическое следствие критично для бизнеса. В Kaiten внутренний AI-редактор с подробным системным промптом выдаёт приемлемый результат на YandexGPT, Llama, Claude и GPT одновременно — разница между провайдерами в их метриках стала несущественной. Большая задача, разложенная на маленькие с чёткими инструкциями, работает и без флагмана. Это означает: накопленный harness — конкурентное преимущество, которое не отчуждается при смене провайдера.

Где обвязка ломается — важно назвать честно. Harness работает там, где есть повторяемость. Когда вы делаете что-то впервые, разбираетесь с новым доменом — обвязки ещё неоткуда взяться. Попытка построить контур до того, как сам понял процесс — частая причина, почему AI-инициатива не взлетает. По открытым оценкам, большинство корпоративных AI-пилотов не дают измеримого эффекта именно по этой причине: команды строят обвязку вокруг процесса, который сами ещё не прошли руками.

Кейсы применения в бизнесе

B2B SaaS стартап. Kaiten автоматизировали производство лендингов: продакт или сейлз с готовым ТЗ собирает брендированный лендинг сам, без дизайнера и фронтенда. На входе — JSON-бриф с продуктом и аудиторией; на выходе — TSX-компонент, который мержится как обычный PR. Harness включает: скилл под конверсионный лендинг с awareness-уровнями аудитории, registry разрешённых компонентов из дизайн-системы (валидатор отсекает всё вне белого списка), проверки бренда и visual regression перед approval. Цепочка маркетолог → копирайтер → дизайнер → фронтенд — закрыта одним harness.

Корпорация с legacy. Перепроектирование тарифной сетки в Kaiten — около 100 md-файлов с расчётами и версиями. Без обвязки агент тонет в объёме. С обвязкой — индекс файлов с короткими описаниями, отдельные скиллы под навигацию, сборку сводок и сравнение версий. Агент подтягивает релевантное по запросу, не читая всё подряд. Автономный агент-багфиксер замыкает цикл починки без ротации разработчиков на дежурство.

SMB / локальный бизнес в КР/СНГ. Старт с CLAUDE.md и одного скилла под повторяющийся класс задач — типовые ответы в саппорте, договоры, коммерческие предложения. Первый месяц — руками понять, что повторяется. Второй — перевести в системный промпт. Каждая ошибка агента становится правилом. Это Ratchet Principle по Османи: накопление по «храповику» без возврата назад.

Кейсы в личной жизни

Разработчик. Начать с CLAUDE.md в каждом репозитории: правила архитектуры, запрещённые паттерны, скиллы под review и тесты. Каждый новый проект в Kaiten стартует с этого файла — и за полгода внутренняя SaaS-ка из Google-таблицы превратилась в полноценный продукт. Не за счёт лучшей модели, а за счёт накопленных правил.

Контент-мейкер / маркетолог. Скилл под лендинги по ТЗ, скилл под SEO-статьи, скилл под соцсети — каждый с жёсткими правилами бренда и tone of voice. Вместо бесконечного диалога с моделью до приемлемого ответа — предсказуемый результат с одного промпта. Это не про ChatGPT в браузере, это про Claude Code с настроенным контуром.

Студент / фрилансер. Формат llms.txt — первый практический шаг: компактный индекс ваших заметок, шаблонов, базы знаний в корне проекта. LLM сама находит релевантный кусок без того, чтобы тащить всё в контекст. Anthropic и Cursor уже поддерживают формат — внедряется за час.

Как применить сегодня

Найдите свои повторяющиеся запросы — то, что делаете снова и снова с похожим ожидаемым результатом. Разработчик: работа с legacy. Продакт: спецификации. Маркетолог: лендинги. Саппорт: типовые ответы.
Создайте CLAUDE.md или AGENTS.md в вашем проекте и опишите правила для этого класса задач. Один файл — уже harness.
Добавьте один скилл под главный повторяющийся сценарий: системный промпт + инструкция что делать с входными данными + ожидаемый формат выхода.
Каждую ошибку агента — в правило. Ratchet Principle: фиксируй ошибку → добавь правило → система не бьётся о те же грабли.
Попробуйте llms.txt в корне проекта — компактный индекс вашей документации. За час снижает «context rot» и экономит токены на каждом запросе.

«A decent model with a great harness beats a great model with a bad harness» — Эдди Османи, Google

#harness #context engineering #Claude Code #LLM агенты #автоматизация

← Все статьи