2026-05-16 22:01 · 🌐 СНГ (tech/AI)

Как устроен production-агент: Anthropic открыла свои промпты

Anthropic выложила в открытый доступ системные инструкции, на которых работает Claude Research — 22 КБ production-кода с 13 структурными блоками. Это не учебный пример: внутри видны следы живой отладки, жёсткие потолки и даже сломанный инструмент с пометкой «не используй никогда».

В репозитории anthropics/claude-cookbooks лежат три файла, на которых работает фича Claude Research: research_lead_agent.md (22.6 КБ), research_subagent.md (8.9 КБ) и citations_agent.md. Это production-инструкции — не демо-код, не туториал. На них прямо сейчас работают research-задачи в Claude. Разбор двух первых файлов по блокам даёт самый короткий путь к пониманию того, что в 2026 году отличает рабочего агента от промпта в чатботе.

Контекст

С мая 2025 года в инженерной культуре Anthropic произошёл сдвиг: они перестали называть свою дисциплину prompt engineering и начали говорить о context engineering. Определение из инженерного блога: стратегии для отбора и поддержания оптимального набора токенов в процессе вывода LLM. Системный промпт — лишь одна часть того, что модель видит в момент генерации следующего токена. Остальное — история сообщений, описания инструментов, результаты их вызовов, приложенные файлы.

Математика жёсткая: нагрузка attention-механизма растёт квадратично от длины контекста. Удвоил контекст — учетверил нагрузку. Anthropic называет деградацию качества на длинных контекстах context rot: не отказ, а медленная просадка. Модель не «забывает» факты резко — она постепенно перестаёт их применять. Это и есть главная причина, почему production-агент не кладёт в контекст «всё что может пригодиться».

Claude Research использует паттерн orchestrator-worker: один lead-агент координирует команду суб-агентов, каждый из которых работает в чистом контекстном окне. По данным Anthropic, такая архитектура даёт +90.2% к качеству на research-задачах по сравнению с одним агентом — именно потому, что каждый суб-агент не тратит attention budget на чужие куски задачи.

Аналитика

Два промпта показывают разрыв между «агентом» и production-агентом. Lead знает свою роль с первой строки: он координатор, а не исполнитель. Суб-агент знает: он не пишет итоговый отчёт — он сжимает результат для lead-а. Без явной ролевой фиксации агент начинает делать всё подряд. Это не стилистический выбор — это архитектурный constraint, зашитый в первое предложение инструкции.

Самый ценный блок в промптах — research budget: явный потолок вызовов инструментов по сложности задачи. Простые — до 5 вызовов, сложные — до 15, lead-агент — максимум 20 суб-агентов. Не «работай эффективно», а числовой лимит. Это главный рычаг управления стоимостью: без него агент входит в цикл уточнений и не останавливается. Формула «потолок + явная инструкция сообщить о превышении» — прямой перенос из production в любой собственный агент.

Показательна и живая запись об отладке в промпте: DO NOT use the evaluate_source_quality tool ever — it is broken. Это не технический долг — это сигнал о природе production-кода. Промпты агентов — живые документы, которые патчатся по результатам реальных сбоев. Значит, строить агента «раз и навсегда» — неправильная установка. Правильная — итеративный процесс с явными маркерами известных проблем прямо в тексте инструкции.

Кейсы применения в бизнесе

B2B-SaaS стартап с research-функцией. Если у вас есть feature типа «проанализируй рынок» или «найди конкурентов» — архитектура orchestrator-worker с явными research budget лимитами позволяет контролировать и стоимость (токены суб-агентов), и качество. Берёте скелет SKILL.md из claude-cookbooks, адаптируете роли под свои инструменты (CRM, внутренняя база, web_search), добавляете блок приоритета внутренних данных — и получаете предсказуемый агент вместо «умного промпта».

Корпорация с legacy-системами. Блок internal tools priority из промптов Anthropic решает конкретную проблему: модель по умолчанию идёт в интернет, даже если ответ лежит во внутреннем Confluence или SharePoint. Один абзац в системном промпте — «при наличии корпоративных документов используй MCP-коннектор к ним первым» — меняет поведение агента без переписывания всей архитектуры.

SMB и локальный бизнес в КР/СНГ. Паттерн суб-агентов применим даже без multi-agent фреймворка: можно запускать несколько Claude Code CLI процессов параллельно через subprocess, каждый с узкой задачей (собрать данные по сегменту → синтезировать → проверить источники). Блок source quality из промптов — готовый чек-лист для агента, который работает с локальными новостными источниками и маркетинговыми материалами: анонимные источники, будущее время, превосходные степени — флаги для проверки.

Кейсы в личной жизни

Разработчик, строящий своего агента. Структура 13 блоков из разбора — готовый чек-лист для ревью собственного системного промпта. Проверить: есть ли явная роль в первой строке? Есть ли пронумерованный процесс? Есть ли OODA-инструкция после каждого вызова инструмента? Есть ли числовой потолок? Обычно обнаруживается, что из 13 блоков присутствуют 3-4.

Контент-мейкер или аналитик. OODA loop — наблюдай, ориентируйся, решай, действуй — работает не только для агентов. Если вы используете Claude для исследований, добавьте в свой пользовательский промпт инструкцию: «после каждого результата напиши, что узнал, что осталось узнать, какой шаг следующий». Качество рассуждения на длинных задачах заметно вырастет.

Студент или фрилансер с ограниченным бюджетом токенов. Блок про типы задач (depth-first / breadth-first / straightforward) — практический инструмент экономии. Перед запуском длинного промпта задайте себе: это один вопрос с разных углов или несколько параллельных подзадач? Для straightforward-вопроса не нужен сложный цепочечный промпт — хватит одного запроса. Классификация до выполнения экономит токены и время.

Как применить сегодня

Откройте репозиторий anthropics/claude-cookbooks, папка patterns/agents/prompts/ — прочитайте research_lead_agent.md и research_subagent.md целиком. Коммит 46f21f95 фиксирует версию из разбора.
Возьмите свой системный промпт агента и проверьте: есть ли в нём явная роль в первой строке, пронумерованный процесс, OODA-инструкция и числовой потолок вызовов инструментов. Если нет хотя бы одного — добавьте.
Если агент работает с внутренними данными (база знаний, CRM, документы) — добавьте блок «при наличии внутренних источников используй их первыми, до web_search». Без этого модель будет искать в интернете то, что лежит в приложенном документе.
Для long-running задач инжектируйте текущую дату как переменную шаблона. Без этого «свежие данные» для модели означают «свежие до даты обучения».
Если у вас несколько независимых вызовов инструментов — добавьте явную инструкцию «вызывай параллельно, когда инструменты независимы». Модель по умолчанию работает последовательно.

«Минимум токенов, максимум сигнала — это даёт лучший шанс получить нужный результат.» — Anthropic, context engineering guidelines

#агенты #Anthropic #context engineering #prompt engineering #Claude

← Все статьи