Независимый инженер, тестирующий языковые модели с 2022 года, опубликовал разбор, который быстро разошёлся в developer-сообществе. Его тезис прямой: американские frontier-модели остановились на S-кривой, Qwen 3.7 Max закрыл функциональный разрыв, а продолжать платить мультипликатор за Claude или GPT — значит симпить по бренду, а не покупать интеллект. Называет он это OnlyFans-экономикой AI.
Контекст
Автор — инженер, начинавший с SymbolicAI-демо на GPT-3 в конце 2022 года. Его метод тестирования: минимум 30 дней погружения в реальные проекты разной сложности, сбор логов, глубокий бенчмаркинг. Не одночасовые toy-тесты, не ротация геометрических фигур в браузере.
В качестве надёжного ориентира он называет Artificial Analysis Intelligence index, но с оговоркой: числа там нелинейны. Прыжок с 57 до 58 — огромный. Три модели на отметке 57 могут быть spread по диапазону low/mid/high. Именно в этой зоне сейчас находятся US-модели, которые, по его оценке, перестали зарабатывать свой ценовой мультипликатор. Параллельно он еженедельно смотрит OpenRouter rankings — как сигнал из реального потребления: «разработчики голосуют кошельком».
На этом фоне — Qwen 3.7 Max от Alibaba. Семейство Qwen он называет уже legacy для open-source движения. Никакой продуктовой обфускации с «xhigh» и «ultracode». Native extended-thinking, которое можно включать и выключать. Через OpenRouter — $100 за 100K кредитов, в том же плане DeepSeek, Moonshot, MiniMax. Он использует модель как основную уже около двух недель.
Аналитика
Метафора точная. В OnlyFans-экономике ценность продукта определяется не объективным качеством, а parasocial-связью с создателем. Симп платит за ощущение близости к бренду. В AI — та же механика: компании вливают бюджеты в корпоративные подписки на US-модели, не устанавливая лимиты потребления и не проводя сравнительного бенчмаркинга. Автор называет это case study потерь, а не успеха.
Ключевой тезис: «премия, которую вы платите, теперь больше о географии, чем об интеллекте». Это важнее, чем звучит. US AI-компании продают не только модели — они продают американскую техно-культурную идентичность, доступ к экосистеме, ощущение «лучшего». Когда технический разрыв закрывается, это ощущение остаётся единственным реальным дифференциатором. Но оно стоит денег.
Особенно интересен аргумент про S-кривую: сами US-компании допускают, что траектория роста «may» оказаться S-образной — за ускорением следует плато. Если принять это, мы сейчас в точке изгиба. Момент, когда рационально остановиться и спросить: за что именно платим, и есть ли дешевле то же самое.
Кейсы применения в бизнесе
B2B SaaS стартап (до $1M ARR): Если backend генерирует тысячи вызовов к LLM в месяц — посчитайте cost per token Qwen 3.7 Max через OpenRouter против текущего провайдера. Для стандартных задач — summarization, code review, генерация текста — функциональная разница минимальна, ценовая — существенна. Задача: 30-дневный A/B тест на реальном трафике с логированием качества выходов. Не на демо-данных.
Корпорация с legacy и AI-подписками: Первый шаг — аудит фактического потребления. Сколько токенов реально расходуется? Установлены ли лимиты? Автор прямо указывает: отсутствие лимитов — одна из главных причин неконтролируемых AI-расходов. Второй шаг: классифицировать задачи (long-running automation vs разовые запросы) и маршрутизировать трафик между провайдерами по cost-quality профилю.
SMB в КР/СНГ: OpenRouter с планом $100/100K кредитов — реальная точка входа в качественный AI без корпоративных контрактов. Для локального бизнеса: автоматизация документооборота, клиентская поддержка, анализ данных. Qwen показывает сильные результаты на многоязычных задачах — плюс для рынков, где русский и местные языки критичны.
Кейсы в личной жизни
Разработчик: Протестируйте Qwen 3.7 Max на задаче, где обычно «оставляешь модель на часы» — рефакторинг большой кодовой базы, генерация тестов, анализ legacy-кода. Автор выделяет это как принципиальное отличие: модели, заточенные под sustained work, а не под one-shot cleverness. Логируйте качество выходов и сравните через месяц реального использования.
Контент-мейкер / аналитик: Extended-thinking позволяет строить длинные аргументные цепочки — полезно для long-form контента, исследовательских отчётов, разбора конкурентов. Тест: дайте одинаковый сложный brief Qwen 3.7 Max и вашей текущей модели. Сравните не только итоговый текст, но и структуру рассуждений в режиме thinking.
Студент / фрилансер: $100/100K кредитов — альтернатива фиксированным подпискам. Один план даёт доступ к нескольким провайдерам. Если вы платите за Claude Pro или ChatGPT Plus, но используете их непостоянно — посчитайте реальный cost per generated token. Сценарий: переключиться на OpenRouter pay-as-you-go и реинвестировать разницу в другие инструменты.
Как применить сегодня
- Зайдите на OpenRouter, откройте актуальные rankings — там отражено реальное потребление разработчиков, а не маркетинговые позиции.
- Проверьте Artificial Analysis Intelligence index: сравните текущие позиции Qwen 3.7 Max, Claude и GPT — смотрите на нелинейность внутри одного балла, а не только на общий rank.
- Прямо сейчас поставьте лимиты токенов в любом AI-инструменте, которым пользуется ваша команда. Это не опция — это контроль бюджета.
- Проведите 30-дневный тест Qwen 3.7 Max на реальной рабочей задаче с логированием — не на toy problem. Через месяц у вас будет данные, а не мнение.
- Если используете extended-thinking — попробуйте toggle on/off в Qwen на задачах разного типа: посмотрите, как меняется структура рассуждений и качество финального ответа.