Команда Kaiten год работает в Claude Code, пробует разных провайдеров и ведёт внутренние метрики качества. Главный итог — не тот, которого ожидали. Смена модели даёт ощутимый, но конечный прирост. Зрелый harness — системный промпт, инструменты, контекст, скиллы, хуки, разрешения и память — умножает этот прирост кратно. Без него даже топовый Claude работает как экскаватор без рычагов.
Контекст
Термин harness (обвязка) в LLM-инженерии — это весь контур, в котором живёт модель. Эдди Османи из Google сформулировал это в апреле 2026-го: Agent = Model + Harness. Его ключевой тезис: зрелая обвязка вокруг средней модели бьёт сырую обвязку вокруг топовой. Независимо его подтвердил Gabriel Chua из OpenAI: Codex-модели обучаются в присутствии harness — tool use, execution loops, итеративная верификация встроены в то, как модель учится работать, а не надстроены сверху.
Структуру harness удобно читать через практический гайд инженера Youngju Kim (март 2026): семь блоков — system-prompt, tools, context, skills, hooks, permissions, memory. Если у вас есть CLAUDE.md, пара slash-команд и pre-commit хуки — у вас уже зрелый harness, просто называется иначе.
Параллельно Anthropic Engineering выпустили две статьи: в сентябре 2025-го про «context rot» — чем больше контекста, тем хуже модель его удерживает, и курировать его надо как конечный ресурс. В октябре — про «progressive disclosure»: метаданные триггерят релевантность скилла, полная документация подгружается только при необходимости. Джереми Ховард из Answer.AI стандартизировал это в формате llms.txt — компактный индекс в корне проекта, который за год поддержали Anthropic, Cursor и масса docs-сайтов.
Аналитика
Почему независимые инженеры из Google, OpenAI, Anthropic, Answer.AI за полгода пришли к одному? Не потому что индустрия «сошлась». Это нормальная фаза взросления любого, кто прошёл с LLM достаточный путь. Глубина использования упирается в потолок предсказуемости — и его модель сама не пробивает. Пробивает обвязка.
Практическое следствие критично для бизнеса. В Kaiten внутренний AI-редактор с подробным системным промптом выдаёт приемлемый результат на YandexGPT, Llama, Claude и GPT одновременно — разница между провайдерами в их метриках стала несущественной. Большая задача, разложенная на маленькие с чёткими инструкциями, работает и без флагмана. Это означает: накопленный harness — конкурентное преимущество, которое не отчуждается при смене провайдера.
Где обвязка ломается — важно назвать честно. Harness работает там, где есть повторяемость. Когда вы делаете что-то впервые, разбираетесь с новым доменом — обвязки ещё неоткуда взяться. Попытка построить контур до того, как сам понял процесс — частая причина, почему AI-инициатива не взлетает. По открытым оценкам, большинство корпоративных AI-пилотов не дают измеримого эффекта именно по этой причине: команды строят обвязку вокруг процесса, который сами ещё не прошли руками.
Кейсы применения в бизнесе
B2B SaaS стартап. Kaiten автоматизировали производство лендингов: продакт или сейлз с готовым ТЗ собирает брендированный лендинг сам, без дизайнера и фронтенда. На входе — JSON-бриф с продуктом и аудиторией; на выходе — TSX-компонент, который мержится как обычный PR. Harness включает: скилл под конверсионный лендинг с awareness-уровнями аудитории, registry разрешённых компонентов из дизайн-системы (валидатор отсекает всё вне белого списка), проверки бренда и visual regression перед approval. Цепочка маркетолог → копирайтер → дизайнер → фронтенд — закрыта одним harness.
Корпорация с legacy. Перепроектирование тарифной сетки в Kaiten — около 100 md-файлов с расчётами и версиями. Без обвязки агент тонет в объёме. С обвязкой — индекс файлов с короткими описаниями, отдельные скиллы под навигацию, сборку сводок и сравнение версий. Агент подтягивает релевантное по запросу, не читая всё подряд. Автономный агент-багфиксер замыкает цикл починки без ротации разработчиков на дежурство.
SMB / локальный бизнес в КР/СНГ. Старт с CLAUDE.md и одного скилла под повторяющийся класс задач — типовые ответы в саппорте, договоры, коммерческие предложения. Первый месяц — руками понять, что повторяется. Второй — перевести в системный промпт. Каждая ошибка агента становится правилом. Это Ratchet Principle по Османи: накопление по «храповику» без возврата назад.
Кейсы в личной жизни
Разработчик. Начать с CLAUDE.md в каждом репозитории: правила архитектуры, запрещённые паттерны, скиллы под review и тесты. Каждый новый проект в Kaiten стартует с этого файла — и за полгода внутренняя SaaS-ка из Google-таблицы превратилась в полноценный продукт. Не за счёт лучшей модели, а за счёт накопленных правил.
Контент-мейкер / маркетолог. Скилл под лендинги по ТЗ, скилл под SEO-статьи, скилл под соцсети — каждый с жёсткими правилами бренда и tone of voice. Вместо бесконечного диалога с моделью до приемлемого ответа — предсказуемый результат с одного промпта. Это не про ChatGPT в браузере, это про Claude Code с настроенным контуром.
Студент / фрилансер. Формат llms.txt — первый практический шаг: компактный индекс ваших заметок, шаблонов, базы знаний в корне проекта. LLM сама находит релевантный кусок без того, чтобы тащить всё в контекст. Anthropic и Cursor уже поддерживают формат — внедряется за час.
Как применить сегодня
- Найдите свои повторяющиеся запросы — то, что делаете снова и снова с похожим ожидаемым результатом. Разработчик: работа с legacy. Продакт: спецификации. Маркетолог: лендинги. Саппорт: типовые ответы.
- Создайте
CLAUDE.mdилиAGENTS.mdв вашем проекте и опишите правила для этого класса задач. Один файл — уже harness. - Добавьте один скилл под главный повторяющийся сценарий: системный промпт + инструкция что делать с входными данными + ожидаемый формат выхода.
- Каждую ошибку агента — в правило. Ratchet Principle: фиксируй ошибку → добавь правило → система не бьётся о те же грабли.
- Попробуйте llms.txt в корне проекта — компактный индекс вашей документации. За час снижает «context rot» и экономит токены на каждом запросе.
«A decent model with a great harness beats a great model with a bad harness» — Эдди Османи, Google