2026-06-18 08:01 · 🤖 AI World

GLM-5.2: китайцы выпустили сильнейший открытый LLM на MIT

Z.ai выложил GLM-5.2 под MIT-лицензией — 753 миллиарда параметров, контекст в миллион токенов, и первое место среди всех open weights моделей по независимым бенчмаркам. Текст без картинок, зато дешевле GPT-5.5 в 3,5 раза.

16 июня 2026 года китайская лаборатория Z.ai опубликовала GLM-5.2 с открытыми весами под лицензией MIT. За три дня до этого модель получили подписчики платного coding-плана. Размер модели — 753B параметров, весит 1,51 ТБ, работает на архитектуре Mixture of Experts с 40 активными параметрами. Контекстное окно выросло с 200 000 токенов (GLM-5.1) до 1 миллиона.

Контекст

Z.ai — китайская лаборатория, стоящая за серией GLM (General Language Model). Предыдущие релизы GLM-5 и GLM-5.1 уже привлекали внимание сообщества, но оставались в тени DeepSeek и Qwen. GLM-5.2 меняет расклад.

Важный нюанс: GLM-5.2 — чисто текстовая модель. У Z.ai есть отдельная линейка с поддержкой изображений (GLM-5V-Turbo), но она закрытая. Авторы сделали ставку на текст и код — и попали точно в нишу, где open source особенно ценится: серверные пайплайны, агентные сценарии, RAG, кодогенерация.

MIT-лицензия — это принципиально. Не Apache 2 с оговорками, не «community license» с ограничениями на коммерческое использование. Можно брать, дорабатывать, встраивать в продукт без лицензионных рисков. На фоне того как некоторые лаборатории закручивают условия использования, это сигнал.

Аналитика

Artificial Analysis — один из наиболее независимых бенчмаркеров в индустрии — поставил GLM-5.2 на первое место в Intelligence Index v4.1 с баллом 51. Следом идут MiniMax-M3 (44), DeepSeek V4 Pro max (44), Kimi K2.6 (43). Разрыв существенный. В Code Arena WebDev leaderboard — второе место, после Claude Fable 5. Это рейтинг по frontend-задачам, включая agentic coding — и попасть в топ-2 без поддержки изображений неожиданно.

Есть и оборотная сторона: модель токеноёмкая. На одну задачу из Intelligence Index она тратит 43k output-токенов — против 26k у GLM-5.1 и 24k у MiniMax-M3. Для задач с API-оплатой это ощутимо. При цене $4.40 за миллион output-токенов — против $25 у Claude Opus 4.x — разница всё равно в пользу GLM-5.2, но расход токенов нужно держать в уме при проектировании пайплайнов.

Более широкий паттерн: открытые китайские модели планомерно сокращают разрыв с проприетарными. DeepSeek, Qwen, Kimi, теперь GLM-5.2 — это уже не «почти так же хорошо», а конкурентный уровень по ряду задач. Для компаний, которые не могут или не хотят зависеть от API одного вендора, это означает реальную альтернативу.

Кейсы применения в бизнесе

B2B-SaaS стартап: если в продукте есть генерация текста или код-ассистент, GLM-5.2 можно развернуть self-hosted и убрать зависимость от OpenAI/Anthropic. Контекст в миллион токенов позволяет загружать полные кодовые базы или большие документы без чанкинга. MIT-лицензия снимает юридические вопросы при перепродаже.

Корпорация с legacy: интеграция через OpenRouter уже доступна — 9 провайдеров, $1.40/$4.40 за миллион токенов. Можно тестировать без собственного деплоя прямо сейчас. Для внутренних RAG-систем по документации или аналитики договоров — хорошая точка входа перед принятием решения о self-hosted развёртывании.

SMB в КР и Центральной Азии: агентства и небольшие продуктовые команды, которые строят автоматизацию на AI, но чувствительны к стоимости API, получают сильную текстовую модель по цене в разы ниже топовых проприетарных. Для задач типа обработки входящих заявок, генерации описаний, суммаризации — соотношение цена/качество будет сложно перебить.

Кейсы в личной жизни

Разработчик: GLM-5.2 уже доступен через OpenRouter — попробуйте его на задачах рефакторинга или ревью кода. Второе место в Code Arena WebDev — это не маркетинг, а пользовательские голоса. Сравните с вашим текущим инструментом на реальной задаче.

Контент-мейкер или исследователь: контекст в миллион токенов — это возможность загрузить целую книгу, архив интервью или длинный исследовательский документ и работать с ним как с единым целым. Без разбивки на части, без потери связей между разделами.

Студент или фрилансер: через OpenRouter модель доступна напрямую, цены ниже GPT-5.5 и Claude Opus. Для написания, анализа, помощи с кодом — полноценная замена дорогим подпискам, если работаете через API или self-hosted клиент типа Open WebUI.

Как применить сегодня

Зайдите на OpenRouter, добавьте GLM-5.2 в список моделей — он доступен у 9 провайдеров по одной цене.
Сравните GLM-5.2 с вашей текущей моделью на 3-5 реальных задачах из работы — бенчмарки хороши, но своя задача важнее.
Для agentic-пайплайнов учитывайте высокий расход output-токенов: ставьте явные ограничения на длину ответа в системном промпте.
Если рассматриваете self-hosted: MIT-лицензия означает коммерческое использование без ограничений — уточните требования к железу под 1.51 ТБ весов.
Следите за тем, откроет ли Z.ai веса GLM-5V (версия с картинками) — пока она закрытая, но прецедент с GLM-5.2 обнадёживает.

#open-weights #GLM-5.2 #Z.ai #LLM #MoE

← Все статьи