2026-06-10 04:01 · 🤖 AI World

AgentsView: считай токены как деньги — и добавляй свои цены

Wes McKinney — автор pandas — сделал инструмент для трекинга токенов по всем AI-агентам на ноутбуке. Когда в базе нет нужной модели, можно добавить цену вручную — и Саймон Уиллисон показал как это работает.

Саймон Уиллисон, один из самых внимательных наблюдателей LLM-экосистемы, опубликовал короткую, но показательную заметку: он взял AgentsView от Wes McKinney, обнаружил что новая модель не попала в базу цен инструмента, разобрал код изнутри и за короткое время добавил кастомную цену вручную. Итог — полноценный treemap расходов по всем локальным проектам за день.

Контекст

Wes McKinney — создатель библиотеки pandas, человек, который буквально изменил то, как data-специалисты работают с таблицами. AgentsView — его более свежий проект: десктопный инструмент для агрегации и визуализации токен-расходов по нескольким AI-агентам одновременно. Целевая аудитория — разработчики, которые ведут несколько coding-агентов параллельно (Claude Code, Cursor, Copilot и подобные) и хотят видеть реальную картину затрат.

Проблема, с которой столкнулся Уиллисон, типична: новые модели выходят быстрее, чем успевают обновляться базы данных сторонних инструментов. Pricing database в AgentsView не успела включить актуальную версию — и треккер просто не знал, как считать стоимость. Это не баг, это структурный вызов всего сегмента AI observability.

То, что McKinney сделал этот инструмент extensible — то есть позволяющим добавлять кастомные цены без правок исходника — говорит о зрелости подхода. В мире, где модели меняются каждые несколько недель, жёстко зашитые прайс-листы моментально устаревают.

Аналитика

Токен-трекинг становится отдельной дисциплиной — примерно как cloud cost management стал обязательной частью DevOps три-четыре года назад. Тогда компании тоже поначалу не следили за расходами на EC2 и S3 «в реальном времени», пока счёт не прилетал в конце месяца. С AI-агентами история повторяется: команды запускают несколько агентов, каждый делает десятки LLM-вызовов в час, и без нормального трекинга месячный счёт становится сюрпризом.

Визуализация в формате treemap — правильный выбор для этой задачи. Сразу видно, какой проект «ест» токены, какая модель дороже других, где концентрируется активность. Это не просто красивая картинка — это инструмент принятия решений: перевести ли часть задач на более дешёвую модель, переписать ли жадный промпт, убрать ли лишние обращения к контексту.

То, что Уиллисон смог reverse-engineer AgentsView с помощью самого же Claude — хороший пример agentic workflow на практике: попросил модель разобрать код инструмента и найти точку расширения. Это и есть рабочий паттерн 2026 года — агент помогает настроить агента.

Кейсы применения в бизнесе

B2B SaaS стартап с несколькими разработчиками. Команда из 3–5 человек, каждый гоняет Claude Code + Cursor ежедневно. Без трекинга — непонятно, сколько реально стоит разработка в AI-часах. AgentsView или аналог ставится на каждый ноутбук, данные агрегируются в общую таблицу. Становится видно: 60% токенов уходит на рефакторинг тестов — задача, которую можно перевести на Haiku вместо Sonnet. Экономия существенная при масштабировании команды.

Корпорация с legacy-инфраструктурой. Внутренний AI-центр компетенций развернул несколько агентов для автоматизации code review и документации. ИТ-директор хочет видеть ROI. Трекинг токенов + кастомные цены для on-premise моделей (Qwen, LLaMA через OpenRouter) дают числа для отчёта: стоимость автоматической проверки одного PR — X тенге/сом против Y тенге ручной работы джуна.

SMB или фрилансер в КР/СНГ. Работаешь на нескольких клиентов, используешь AI-инструменты по Claude Max подписке. Вопрос: сколько «стоит» этот клиент в токенах? AgentsView с разбивкой по проектам даёт ответ. Можно обоснованно пересчитать hourly rate или выставить дополнительную стоимость за AI-интенсивные задачи.

Кейсы в личной жизни

Разработчик, ведущий несколько pet-проектов. Запускаешь Claude Code на двух-трёх репозиториях параллельно. Treemap покажет, куда реально уходит время и токены — иногда выясняется, что один проект «сжигает» 80% ресурса, хотя субъективно казалось иначе. Это помогает расставить приоритеты.

Контент-мейкер или копирайтер. Активно используешь LLM для черновиков, редактуры, SEO. Кастомный трекинг помогает понять: какой тип задач дорогой (длинный контекст, итерации), а где можно обойтись более дешёвой моделью без потери качества.

Студент или исследователь. Работаешь с arXiv, пишешь дипломную, прогоняешь материал через AI. Если сидишь на бесплатном тире — трекинг помогает не выбить лимит в середине рабочего дня, заранее видя, сколько токенов осталось.

Как применить сегодня

Найди AgentsView (проект Wes McKinney) и установи на свой рабочий ноутбук — он работает локально и агрегирует данные из нескольких агентов.
Если нужная модель не в базе, открой исходник и найди pricing config — Уиллисон показал, что это занимает минуты, особенно если попросить Claude разобрать структуру за тебя.
Запроси у агента: «Посмотри файл [pricing_config] и покажи, как добавить кастомную запись для модели X с ценой $Y per million tokens» — стандартный паттерн reverse-engineering через Claude.
Разбей трекинг по проектам/клиентам с первого дня — агрегированные данные без контекста бесполезны, а по проектам сразу видно ROI.
Раз в неделю смотри на treemap и задавай себе один вопрос: «Какой сегмент можно перевести на модель дешевле без потери результата?» Это и есть AI cost optimization на практике.

#AgentsView #токены #AI costs #observability #LLM

← Все статьи