← Все статьи
2026-07-03 21:04 · 🤖 AI World

Fable 5, GLM-5.2 и конец токенмаксинга — главное за июнь 2026

Симон Уиллисон выпустил июньский дайджест об LLM: Claude Fable 5 и GPT-5.6 вышли на рынок, американские экспортные ограничения на AI ужесточились, GLM-5.2 занял первое место среди открытых моделей — и токенмаксинг официально объявлен устаревшей стратегией.

Fable 5, GLM-5.2 и конец токенмаксинга — главное за июнь 2026

Симон Уиллисон — создатель Datasette, sqlite-utils и shot-scraper — выпустил июньский платный дайджест. Главные темы: релизы Claude Fable 5 и GPT-5.6, американские экспортные ограничения на AI, GLM-5.2 как новый лидер среди открытых весовых моделей и смерть токенмаксинга. Параллельно — практика: агентская видеозапись браузера и первый релиз-кандидат sqlite-utils 4.0 с нативными миграциями.

Контекст

Уиллисон ведёт один из самых уважаемых независимых блогов об LLM-экосистеме. Он пишет код, а не только комментирует пресс-релизы — его инструменты Datasette и shot-scraper используются тысячами разработчиков. Ежемесячный дайджест — это платный кураторский срез за $10 в месяц: подписчики получают сводку на месяц раньше бесплатных читателей. Отбор темный и без корпоративных интересов.

Июнь оказался насыщенным. Anthropic выпустила Claude Fable 5, OpenAIGPT-5.6. США продолжают ужесточать экспортные ограничения на передовые AI-чипы и модели, формируя два параллельных рынка. Китайские разработчики ответили выпуском GLM-5.2 — по оценке Уиллисона, это текущий лидер среди открытых весовых моделей.

Отдельным сигналом стала формулировка из дайджеста: «Tokenmaxxing is so over». Токенмаксинг — практика вбивания максимального объёма контекста в запрос, чтобы модель сама вытащила нужное. В 2024–2025 это был основной трюк. Судя по оценке Уиллисона, тактика потеряла смысл.

Аналитика

Токенмаксинг умирает по двум причинам. Первая: модели нового поколения лучше работают с нерелевантным шумом — засорение окна уже не помогает, а чаще мешает точности. Вторая: RAG-пайплайны, агентская память и структурированное извлечение данных стали зрелыми. Подход «залей всё и надейся» проигрывает аккуратной архитектуре. Команды, которые до сих пор строят промпты по принципу «больше токенов — лучше», теряют точность и платят за лишние токены одновременно.

Выход GLM-5.2 на первое место среди open weights говорит о том, что китайская AI-индустрия ускоряется под давлением экспортных санкций, а не замедляется. Открытые модели теперь реально конкурируют с коммерческими API — разрыв сокращается быстрее, чем большинство прогнозировало год назад. Для бизнеса это конкретный выбор: платить за облачный API или поднять self-hosted решение с сопоставимым качеством.

Американские экспортные ограничения создают раздвоение рынка. Компании в Центральной Азии оказываются в зоне неопределённости: доступ к передовым API может усложниться или подорожать. Открытые модели, которые можно развернуть локально, в этом контексте — не просто экономическое, но и стратегическое решение. Data sovereignty становится реальным требованием, а не абстрактным принципом.

«Tokenmaxxing is so over» — Симон Уиллисон, июньский дайджест 2026

Кейсы применения в бизнесе

B2B-SaaS стартап. shot-scraper video позволяет агенту автоматически записывать видеодемо собственной работы — без ручного тестирования. Вместо лог-файлов вы получаете видеозапись каждого прогона. Интегрируйте в CI/CD: агент отрабатывает сценарий, видео уходит в хранилище, в Slack — уведомление с файлом. Часы ручного QA превращаются в автоматический процесс.

Корпорация с legacy-инфраструктурой. GLM-5.2 открывает сценарий полностью локального развёртывания без зависимости от внешних API. Для enterprise с жёсткими требованиями по compliance и data sovereignty — жизнеспособная альтернатива платным сервисам. Плюс независимость от изменений ценообразования облачных провайдеров, которые в 2025–2026 годах менялись часто.

SMB и локальный бизнес в КР/СНГ. Проекты на базе WebAssembly позволяют запускать небольшие модели прямо в браузере — без сервера, без передачи данных. Практический сценарий: демо AI-продукта работает офлайн на ноутбуке клиента прямо на встрече. Важно там, где интернет нестабилен или клиент осторожен с персональными данными.

Кейсы в личной жизни

Разработчик. sqlite-utils 4.0rc1 добавил поддержку миграций и вложенных транзакций. Если вы работаете с SQLite в скриптах или прототипах — нормальный миграционный workflow теперь без тяжёлого ORM. Для data-engineering сайдпроектов это ощутимое упрощение с минимальными зависимостями.

Контент-мейкер. shot-scraper video автоматизирует скринкасты. Напишите скрипт, который открывает браузер, проходит нужные шаги, записывает видео — и создание обучающих материалов из ручного процесса превращается в автоматический. Без OBS, без ручного запуска.

Студент / фрилансер. Уиллисон адаптировал модель Moebius 0.2B для инпейнтинга изображений под запуск прямо в браузере через Claude Code. Это шаблон: берёте небольшую специализированную модель, адаптируете под WASM — и получаете AI-фичу в веб-проекте без бэкенда и серверных расходов.

Как применить сегодня

  • Проверьте архитектуру промптов: если используете токенмаксинг — перейдите на структурированный retrieval или агентскую память.
  • Протестируйте Claude Fable 5 на сложных многошаговых задачах, где предыдущие версии давали сбои.
  • Для self-hosted нужд — изучите GLM-5.2: по оценкам сообщества, текущий лидер среди открытых весов.
  • Установите shot-scraper и запишите первое видеодемо работы вашего агента — это занимает 20 минут и сильно помогает при дебаггинге.
  • Если ваши скрипты работают с SQLite — обновитесь до sqlite-utils 4.0rc1 и получите встроенные миграции.
← Все статьи