Обзорная работа, появившаяся в академическом сообществе, формулирует тезис, который меняет угол зрения на agentic AI: код — не артефакт, который агент генерирует на выходе. Код — это среда, в которой агент рассуждает, планирует и действует. Из этого следует неудобный вывод для тех, кто строит агентов: модель сама по себе — не самый важный компонент автономной системы.
Контекст
Большинство дискуссий вокруг AI-агентов крутится вокруг одного вопроса — чья модель умнее: GPT-4o, Claude Sonnet, Gemini, Qwen. Авторы обзора предлагают смотреть туда, куда смотрят реже — на harness: программный слой, который оборачивает модель инструментами, памятью, тестами и управлением разрешениями. Именно этот слой превращает stateless LLM в рабочего агента.
Формула проста и прямолинейна:
Модель + harness = AI-агент. Убери harness — останется stateless chatbot, который не помнит контекст между вызовами и не умеет корректно обрабатывать сбои.
Сигнал от рынка подтверждает тезис. DeepSeek в Пекине формирует выделенную команду под названием «Harness». Это не просто внутренняя реорганизация — это ставка на то, что harness-инженерия становится отдельной дисциплиной со своей экспертизой. Компания, которая первой освоит этот слой в масштабе, получит преимущество, которое не нивелируется следующим релизом базовой модели.
Аналитика
Если тезис верен, он переопределяет конкурентный ландшафт. Выигрывает не тот, у кого самая мощная модель, а тот, кто лучше проектирует инфраструктуру вокруг неё. Это хорошая новость для команд, у которых нет ресурсов обучать LLM с нуля — но есть инженеры, которые умеют строить надёжные системы.
Это объясняет взрывной рост harness-фреймворков: MCP (Model Context Protocol от Anthropic), LangGraph, CrewAI, AutoGen. Каждый из них — попытка стандартизировать harness-слой. Бум вокруг MCP в 2025 году — не случайный хайп; это индустрия нащупывает, как выглядит правильная агентная архитектура. Память, инструменты, sandbox, разрешения — это не «обёртка», это ядро системы.
Практический вывод: качество агента определяется прежде всего качеством его тестов и обработки ошибок. Агент без петли обратной связи — это скрипт с галлюцинациями. Добавь валидацию выходов, инструмент проверки результата, механизм retry — и тот же базовый LLM начинает работать совершенно иначе. Большинство бизнес-внедрений этот шаг пропускают.
Кейсы применения в бизнесе
B2B-SaaS стартап. Если продукт включает AI-функцию — email-writer, data analyst, coding assistant — harness — это продуктовый актив, а не технический долг. Кэш контекста, персистентная память пользователя, инструменты с retry-логикой, guardrails для критичных действий — каждый из этих компонентов создаёт барьер для конкурентов, которые «просто подключили API». Разница между «AI-фичей» и «AI-продуктом» — именно здесь.
Корпорация с legacy-системами. Проблема чаще всего не в том, что модель не подходит для задачи, — а в том, что нет harness для интеграции с внутренними системами. Первый шаг: audit текущих AI-точек и добавление к каждой минимального harness: structured output с валидацией, логирование вызовов, fallback при ошибке. Это снижает риск и повышает предсказуемость без замены модели и без полного переписывания.
SMB и локальный бизнес в КР/СНГ. Небольшая компания может развернуть open-source harness — например, на базе LangGraph или простого Python + MCP — с памятью о клиентах и инструментами для работы с CRM. Результат: персонализированный агент поддержки или продаж без найма дорогого разработчика. Harness можно взять готовый — мышление делегируется модели, логика остаётся у команды.
Кейсы в личной жизни
Разработчик. Если строишь агентов — начни с документирования своего harness. Что входит в system prompt? Как устроена память? Как агент обрабатывает ошибку инструмента? Ответы важнее выбора между Claude и GPT. Попробуй добавить к текущему агенту один компонент — например, Pydantic-валидацию structured output — и замерь разницу в надёжности.
Контент-мейкер или фрилансер. Используешь AI для текстов, скриптов, постов? Добавь личный harness: сохраняй system prompt с контекстом бренда, стиля, аудитории. Держи список инструментов (поиск, проверка фактов, шаблоны). Это не про код — это про дисциплину работы с моделью. Одно сохранённое описание контекста — уже минимальный harness.
Студент или исследователь. Harness-мышление применимо к любому RAG-проекту. Не «натравить LLM на PDF», а выстроить: чанкинг → retrieval → reranking → structured answer → fact-check. Каждый шаг — компонент harness. Понимание этого слоя сейчас — навык, который будет стоить дорого через пару лет, когда спрос на agentic-инженеров оформится в отдельную профессию.
Как применить сегодня
- Прочитай спецификацию MCP (Model Context Protocol) — де-факто стандарт harness-интерфейса для инструментов и памяти.
- Audit своего текущего AI-пайплайна: есть ли обработка ошибок, валидация выходов, логирование? Добавь хотя бы одно из трёх.
- Поищи материалы по «LLM agent scaffold» или «agentic harness» на arXiv — там регулярно выходят систематизации архитектур агентов.
- Зафиксируй для себя формулу: модель + harness = агент. Для каждого компонента своего агента ответь: это часть модели или часть harness?
- Попробуй LangGraph или CrewAI на примере простой задачи — они делают harness-слой явным и наглядным, даже если ты не планируешь их использовать в проде.