OpenAI, Anthropic, Google прямо сейчас работают себе в убыток, обслуживая ваши команды. По оценкам, пользователи Anthropic потребляли вычислений примерно на $8 на каждый $1 выручки от подписки. Claude Pro стоит $20 в месяц, но интенсивный пользователь — документы, отчёты, анализ данных — легко сжигает токенов на $200–$400 в месяц по ценам API. Математика не сходится. И это не баг — это стратегия.
Контекст
Модель «захватить рынок ценой ниже себестоимости» стара как SaaS, но в AI она работает на другом масштабе. GitHub Copilot приносил Microsoft убыток свыше $20 на пользователя в месяц, а у тяжёлых пользователей фактические расходы достигали $80 при подписке за $10. Вице-президент OpenAI по продукту Ник Тёрли публично сравнил безлимитные тарифы с «безлимитным электричеством» и высказался за их отмену. ChatGPT Plus держится на $20 уже три года, хотя за это время появились генерация изображений, агентное мышление, голосовой режим и интерпретация кода.
Паттерн у всех одинаков. Google продаёт Gemini Advanced за $20 в составе Google One AI Premium и одновременно берёт реальные деньги за API. xAI предлагает Grok по $0,20 за миллион входных токенов на уровне API — цена имеет смысл только при готовности терпеть убытки ради доли рынка. Meta субсидирует сотни миллионов AI-запросов через рекламную выручку, отдавая Llama бесплатно.
Цель — встроить организации в зависимость до того, как цены нормализуются. И это работает: KPMG AI Quarterly Pulse за Q1 2026 зафиксировал, что американские компании прогнозируют средние расходы на AI в $207 млн за следующие 12 месяцев — почти вдвое больше, чем годом ранее.
Аналитика
Агентный AI сломал даже ту плохую математику, которая существовала раньше. Когда AI был чатботом, потребление токенов было предсказуемым. Агентные сессии — Claude Code, параллельные coding-агенты — работают автономно часами. Пользователи сообщали, что исчерпывали 5-часовые лимиты менее чем за 90 минут. Разработчик с тремя-четырьмя параллельными агентами потребляет не в 3–4 раза больше токенов, чем в режиме чата, а на порядок больше. GitHub это признал официально и с 1 июня 2026 года переходит на тарификацию по использованию — фиксированная модель рухнула под агентными нагрузками.
IPO ускорит развязку. Anthropic, по имеющимся данным, превысила $30 млрд в пересчёте на годовую выручку. OpenAI движется к $25 млрд. Но OpenAI прогнозирует суммарное сжигание денег в $115 млрд к 2029 году и взяла обязательства на $665 млрд в вычислительные мощности к 2030-му. Публичные рынки потребуют маржи и юнит-экономики. Самый быстрый способ закрыть разрыв — поднять цены, ввести лимиты или перейти на pay-as-you-go. Все три варианта ударят по текущим корпоративным подписчикам.
Проблема не в том, что цены вырастут. Проблема в том, что большинство организаций не отслеживают реальное потребление. Руководитель AI and data labs в KPMG North America Свами Чандрасекаран прямо сказал: «Ещё квартал-два назад никто не заботился о стоимости потребления LLM». Команда из 50 человек на Claude Pro — это $1000 в месяц. Эквивалентное потребление по ценам API для той же команды — от $15 000 до $40 000 в месяц. Разрыв в 15–40 раз не заложен ни в один корпоративный бюджет.
Кейсы применения в бизнесе
B2B-SaaS стартап (10–50 человек). Команда использует Claude Pro для написания кода, ревью, документации и customer support. При переходе провайдера на pay-as-you-go расходы могут вырасти в 10–20 раз за ночь. Что делать сейчас: провести токен-аудит по командам, зафиксировать baseline потребления, смоделировать бюджет при ценах ×5 и ×10. Параллельно — тестировать open-source модели (Qwen, DeepSeek) на задачах, где качество frontier-модели избыточно.
Корпорация с legacy-инфраструктурой. Несколько подразделений независимо подключили разных AI-провайдеров. Нет единого учёта, нет консолидированных контрактов. При одновременном повышении цен нескольких провайдеров бюджет взрывается фрагментами — каждый отдел объясняет свой перерасход отдельно. Решение: централизованный AI-бюджет с кодами затрат по подразделениям, единый контракт с приоритетным провайдером, SLA на уведомление об изменении ценообразования.
SMB и локальный бизнес в КР/СНГ. Небольшая компания использует ChatGPT Plus или Claude для маркетинга, переписки, аналитики. При курсовых колебаниях и повышении базовой цены подписки расходы в тенге или сомах могут вырасти в разы без какого-либо предупреждения. Страховка — диверсификация: часть задач перевести на локально развёртываемые модели или более дешёвые провайдеры вроде OpenRouter с routing по стоимости токена.
Кейсы в личной жизни
Разработчик, активно использующий agentic-режим. Параллельные coding-агенты в Claude Code или Cursor сжигают токены на порядок быстрее, чем обычный чат. При переходе на pay-as-you-go месячный счёт может оказаться неожиданным. Стоит уже сейчас отслеживать реальное потребление встроенными инструментами и разделять задачи: тяжёлые агентные сессии — на Sonnet, быстрые запросы — на Haiku или локальные модели.
Контент-мейкер и фрилансер. Безлимитная подписка за $20 ощущается как бесконечный ресурс. Если провайдер введёт жёсткие лимиты или переключится на кредитную модель, привычный воркфлоу прервётся. Практический шаг: освоить хотя бы одну альтернативу — например, Gemini Advanced через Google One или DeepSeek через API — чтобы не зависеть от одного инструмента.
Студент или исследователь. Академическое использование часто попадает под самые жёсткие лимиты при повышении цен — провайдеры в первую очередь монетизируют корпоративный сегмент. Уже сейчас стоит параллельно работать с открытыми моделями через HuggingFace или локальный деплой — как страховка и как навык, который станет ценным по мере того, как frontier-модели дорожают.
Как применить сегодня
- Проведите токен-аудит по командам: сколько реально потребляется, какие задачи самые токеноёмкие. Большинство провайдеров показывают историю использования в личном кабинете или через API.
- Смоделируйте бюджет при ценах ×5 и ×10 от текущих. Если цифра выглядит как проблема — это и есть проблема, которую нужно решить до того, как она стала реальной.
- Протестируйте open-source альтернативы (Qwen 2.5, DeepSeek V3, Llama 3) на задачах, где качество frontier избыточно: классификация, суммаризация, генерация шаблонов. Экономия может составить 90%+.
- Встройте в стек routing по стоимости: лёгкие задачи → Haiku или аналог, тяжёлые → Sonnet, критические → Opus только по явной необходимости.
- Поговорите с CFO до того, как это станет его инициативой. Покажите разрыв между текущими расходами на подписки и эквивалентной стоимостью по API — это самый убедительный аргумент для выделения отдельной строки бюджета на AI.