← Все статьи
2026-05-05 00:01 · 🌐 СНГ (tech/AI)

Пять механизмов памяти Claude — вы используете один из них

Разработчик открыл новую сессию Claude Code через две недели — и получил ответ с деталями, которых не давал в этой сессии. Полез разбираться: обнаружил 16 markdown-файлов с досье на себя и понял, что из пяти механизмов памяти большинство людей пользуются одним.

Пять механизмов памяти Claude — вы используете один из них

Открываешь новую сессию Claude Code в проекте, который не трогал две недели. Спрашиваешь «как там клиент, на каком этапе». В ответ — имя ssh-хоста dev-стенда, срок до приёмки, папка с задачами. Ты это не говорил. По крайней мере, сегодня. Идёшь в ~/.claude/ и находишь папку memory/ с шестнадцатью markdown-файлами. Там лежит всё: контекст по клиентам, предпочтения по тону, серверные правила, истории провалов.

Контекст

Claude Code — это не просто CLI-обёртка над API. Это среда, в которой Claude действует как агент: читает файлы, запускает инструменты, ведёт долгие сессии. При этом LLM сам по себе не имеет памяти между запросами — каждый вызов API начинается с чистого листа. Всё, что Claude «помнит», это то, что подставлено в промпт.

Anthropic реализовала несколько уровней, которые делают это подставление умным: от простого CLAUDE.md, который разработчики знают с первых дней, до auto-memory и MCP Memory Server, о которых большинство пользователей не подозревает. У Sonnet 4.6 окно 200К токенов, у Opus 4.7 в режиме extended thinking — до миллиона. Но дорогие токены это cache_miss, дешёвые — cache_read. Кэш ломается, когда меняется начало промпта, поэтому экономия на памяти — не «хранить меньше», а «положить туда, где кэш не сломается».

Это не академическая история. Разработчики, которые строят агентские пайплайны на Claude Code прямо сейчас, сталкиваются с этими механизмами каждый день — и большинство управляет ими вслепую.

Аналитика

Пять механизмов работают на разных уровнях и решают разные задачи. CLAUDE.md — детерминированный контекст, который всегда в промпте: стек, правила, ограничения. Анти-паттерн — затолкать туда 50К токенов архитектурной доки; правило: держать под 5К символов, остальное — читать по требованию через Read. Auto-memory — файлы, которые Claude пишет сам: feedback («больше так не делай»), project (контекст клиентов), reference (где что лежит). Эти файлы живут сами по себе и устаревают. Не чистить раз в две недели — значит, Claude будет следовать правилам, которые ты уже отменил, и ты не сразу поймёшь почему.

Auto-compact срабатывает, когда сессия подходит к пределу окна: Claude пересжимает историю диалога из ~50К токенов в ~5К краткого пересказа. Теряются точные числа, имена файлов, ход рассуждений, последние 3–5 сообщений. Управляемый /compact руками — лучше, чем автоматический: сам говоришь, что оставить. Subagents через тул Task стартуют с чистого листа без истории основной сессии — это не баг, а фича. Когда основной Claude застрял в гипотезе после двух часов дебага, субагент с одним простым промптом находит ответ за четыре минуты.

MCP Memory Server — отдельный процесс с графом знаний, который виден всем проектам и сессиям одновременно. Это уже не «память про проект», а глобальная база. Нужен только тем, кто строит долгие агентские системы. Плюс — хуки в settings.json, которые пишут лог каждого редактирования файла: через неделю у тебя полная история правок, которую можно скормить новой сессии. И хуки, и MCP Memory — код, который выполняется автоматически. Если в хуке написать rm -rf, будет выполнено.

Кейсы применения в бизнесе

B2B-SaaS стартап с несколькими разработчиками. Команда ведёт три клиентских проекта параллельно. В каждый проект кладут CLAUDE.md со стеком, запретными зонами и правилами деплоя. Auto-memory фиксирует контекст по каждому клиенту: кто менеджер, где dev-стенд, какие договорённости. Новый разработчик, подключившись к проекту, через первый же вопрос получает полный контекст — без часа онбординга. Ожидаемый эффект: сокращение времени переключения между проектами на 30–40%.

Корпорация с legacy-кодом. Есть подсистемы, которые «трогать нельзя» — legacy, на который завязаны скрипты миграции. Правило «не трогай /legacy» прописывается в CLAUDE.md однократно и работает для каждого запроса. Отдельно настраивается хук, который логирует каждое изменение файла: аудит-трейл для compliance без дополнительного инструментария. MCP Memory хранит контакты и связи между командами — кто владелец какого модуля.

SMB или локальная IT-студия в КР/СНГ. Небольшая команда ведёт 5–7 клиентов, часть из которых возвращается раз в несколько месяцев. Auto-memory Claude Code хранит контекст по каждому клиенту в проектной папке: стек, договорённости, особенности. Возобновление работы через месяц — вопрос одного вопроса, а не часа чтения старых переписок. Никаких облачных CRM с персональными данными клиентов, всё локально.

Кейсы в личной жизни

Разработчик на фрилансе. Переключаешься между несколькими проектами в неделю. Каждый проект получает свой CLAUDE.md с правилами, которые не надо объяснять заново. Auto-memory запоминает, что ты предпочитаешь короткие ответы без резюме в конце — и не надо повторять это каждую сессию. Раз в понедельник — 10 минут на чистку ~/.claude/memory/, удаляешь устаревшее.

Контент-мейкер, работающий с AI-инструментами. Создаёшь скрипты, посты, описания. В auto-memory живёт профиль твоего голоса, предпочтений по длине, запрещённые клише. Claude не нужно напоминать о стиле — он уже знает. Если что-то пошло не так («не используй это слово»), feedback сохраняется автоматически.

Студент или исследователь с длинными аналитическими сессиями. Сессия растягивается на несколько часов. Вместо того чтобы ждать auto-compact с непредсказуемыми потерями, делаешь /compact вручную в нужный момент с явным указанием, что сохранить. Если зашёл в тупик в рассуждениях — /clear и субагент с чистым взглядом. Это не перезапуск, это смена перспективы.

Как применить сегодня

  • Зайди в ~/.claude/projects/, найди папку своего проекта и открой memory/MEMORY.md — посмотри, что Claude про тебя знает. Устаревшее удали прямо в редакторе.
  • Проверь CLAUDE.md в корне проекта: если его нет — создай с описанием стека и правилами «не трогать». Если есть и он больше 5К символов — сократи, вынеси детали в отдельные файлы.
  • Следующий раз, когда застрянешь в дебаге больше часа, запусти субагент через Task с минимальным промптом: только код и ошибка, без истории — и посмотри, что он скажет.
  • Настрой один простой хук в settings.json: логировать каждое изменение файла с датой. Через неделю у тебя будет история, которую можно скормить новой сессии.
  • Используй /compact вручную в длинных сессиях до того, как сожмётся автоматически — и укажи явно, что важно сохранить.
«Не хочу LLM с памятью. Я не готов к тому, что они помнят больше, чем я» — это реальная позиция, и она заслуживает уважения. Auto-memory локальна, человекочитаема и редактируется вручную. Это не облачное досье — это markdown-файлы на твоём компе.
← Все статьи