#контекстное окно

Публикаций: 4

Z.ai выпустила GLM-5.2 — миллион токенов без единого бенчмарка

13 июня 2026 года Z.ai запустила GLM-5.2 с контекстным окном в 1 миллион токенов и двумя режимами мышления — без бенчмарков при релизе, зато с обещанием MIT-открытых весов через неделю. Модель сразу работает в Claude Code и Cline через Anthropic-compatible endpoint.

MiniMax M3: открытый вес, миллион токенов и мультимодальность

Китайская MiniMax выпустила M3 — по заявлению разработчиков, первую open-weight модель, которая одновременно берёт контекст в миллион токенов, показывает coding-результаты уровня лучших проприетарных систем и работает с несколькими модальностями нативно.

Длиннее контекст — хуже результат: исследования против интуиции

Семь академических работ и гайды OpenAI с Anthropic подтверждают одно: больше токенов в промпте не делает модель умнее — а зачастую делает хуже. Инженер с 23 годами опыта собрал механику деградации AI-агентов на длинных сессиях.

Self-hosted LLM в проде: где всё ломается и что мерить

Команда AI Platform Битрикс24 вскрыла реальные причины падений self-hosted LLM в продакшене — и это не GPU и не «неправильная» модель. Проблема в наблюдаемости: не видишь — не чинишь.

← Все статьи