Саймон Уиллисон, один из самых внимательных наблюдателей LLM-экосистемы, опубликовал короткую, но показательную заметку: он взял AgentsView от Wes McKinney, обнаружил что новая модель не попала в базу цен инструмента, разобрал код изнутри и за короткое время добавил кастомную цену вручную. Итог — полноценный treemap расходов по всем локальным проектам за день.
Контекст
Wes McKinney — создатель библиотеки pandas, человек, который буквально изменил то, как data-специалисты работают с таблицами. AgentsView — его более свежий проект: десктопный инструмент для агрегации и визуализации токен-расходов по нескольким AI-агентам одновременно. Целевая аудитория — разработчики, которые ведут несколько coding-агентов параллельно (Claude Code, Cursor, Copilot и подобные) и хотят видеть реальную картину затрат.
Проблема, с которой столкнулся Уиллисон, типична: новые модели выходят быстрее, чем успевают обновляться базы данных сторонних инструментов. Pricing database в AgentsView не успела включить актуальную версию — и треккер просто не знал, как считать стоимость. Это не баг, это структурный вызов всего сегмента AI observability.
То, что McKinney сделал этот инструмент extensible — то есть позволяющим добавлять кастомные цены без правок исходника — говорит о зрелости подхода. В мире, где модели меняются каждые несколько недель, жёстко зашитые прайс-листы моментально устаревают.
Аналитика
Токен-трекинг становится отдельной дисциплиной — примерно как cloud cost management стал обязательной частью DevOps три-четыре года назад. Тогда компании тоже поначалу не следили за расходами на EC2 и S3 «в реальном времени», пока счёт не прилетал в конце месяца. С AI-агентами история повторяется: команды запускают несколько агентов, каждый делает десятки LLM-вызовов в час, и без нормального трекинга месячный счёт становится сюрпризом.
Визуализация в формате treemap — правильный выбор для этой задачи. Сразу видно, какой проект «ест» токены, какая модель дороже других, где концентрируется активность. Это не просто красивая картинка — это инструмент принятия решений: перевести ли часть задач на более дешёвую модель, переписать ли жадный промпт, убрать ли лишние обращения к контексту.
То, что Уиллисон смог reverse-engineer AgentsView с помощью самого же Claude — хороший пример agentic workflow на практике: попросил модель разобрать код инструмента и найти точку расширения. Это и есть рабочий паттерн 2026 года — агент помогает настроить агента.
Кейсы применения в бизнесе
B2B SaaS стартап с несколькими разработчиками. Команда из 3–5 человек, каждый гоняет Claude Code + Cursor ежедневно. Без трекинга — непонятно, сколько реально стоит разработка в AI-часах. AgentsView или аналог ставится на каждый ноутбук, данные агрегируются в общую таблицу. Становится видно: 60% токенов уходит на рефакторинг тестов — задача, которую можно перевести на Haiku вместо Sonnet. Экономия существенная при масштабировании команды.
Корпорация с legacy-инфраструктурой. Внутренний AI-центр компетенций развернул несколько агентов для автоматизации code review и документации. ИТ-директор хочет видеть ROI. Трекинг токенов + кастомные цены для on-premise моделей (Qwen, LLaMA через OpenRouter) дают числа для отчёта: стоимость автоматической проверки одного PR — X тенге/сом против Y тенге ручной работы джуна.
SMB или фрилансер в КР/СНГ. Работаешь на нескольких клиентов, используешь AI-инструменты по Claude Max подписке. Вопрос: сколько «стоит» этот клиент в токенах? AgentsView с разбивкой по проектам даёт ответ. Можно обоснованно пересчитать hourly rate или выставить дополнительную стоимость за AI-интенсивные задачи.
Кейсы в личной жизни
Разработчик, ведущий несколько pet-проектов. Запускаешь Claude Code на двух-трёх репозиториях параллельно. Treemap покажет, куда реально уходит время и токены — иногда выясняется, что один проект «сжигает» 80% ресурса, хотя субъективно казалось иначе. Это помогает расставить приоритеты.
Контент-мейкер или копирайтер. Активно используешь LLM для черновиков, редактуры, SEO. Кастомный трекинг помогает понять: какой тип задач дорогой (длинный контекст, итерации), а где можно обойтись более дешёвой моделью без потери качества.
Студент или исследователь. Работаешь с arXiv, пишешь дипломную, прогоняешь материал через AI. Если сидишь на бесплатном тире — трекинг помогает не выбить лимит в середине рабочего дня, заранее видя, сколько токенов осталось.
Как применить сегодня
- Найди AgentsView (проект Wes McKinney) и установи на свой рабочий ноутбук — он работает локально и агрегирует данные из нескольких агентов.
- Если нужная модель не в базе, открой исходник и найди pricing config — Уиллисон показал, что это занимает минуты, особенно если попросить Claude разобрать структуру за тебя.
- Запроси у агента:
«Посмотри файл [pricing_config] и покажи, как добавить кастомную запись для модели X с ценой $Y per million tokens»— стандартный паттерн reverse-engineering через Claude. - Разбей трекинг по проектам/клиентам с первого дня — агрегированные данные без контекста бесполезны, а по проектам сразу видно ROI.
- Раз в неделю смотри на treemap и задавай себе один вопрос: «Какой сегмент можно перевести на модель дешевле без потери результата?» Это и есть AI cost optimization на практике.