19 мая 2026 года на Google I/O вышел Gemini 3.5 Flash — сразу в GA, без промежуточного preview. Google развернул его одновременно: Gemini App, AI Mode в Google Search, Gemini API, AI Studio, Android Studio, платформа Google Antigravity и корпоративный Gemini Enterprise Agent Platform. Контекст: 1 048 576 токенов на вход, 65 536 на выход. Срез знаний — январь 2025. Функция computer use в релиз не вошла.
Контекст
Flash-линейка у Google — это «быстрые и доступные» модели напротив Pro-серии. До 3.5 Flash были Gemini 3 Flash Preview и Gemini 3.1 Flash-Lite: именно на них строились высоконагруженные агентские пайплайны, где стоимость вывода критична. Теперь Google добавил новый Interactions API (beta) — серверное управление историей диалога. По структуре это их ответ на OpenAI Responses API: сессионное состояние хранится на стороне Google, разработчику не нужно передавать историю вручную.
Независимое агентство Artificial Analysis считает реальную стоимость прогона своего бенчмарка с учётом токенизации и reasoning-токенов — это честнее, чем просто смотреть на прайс-лист. Их цифры по новому релизу показательны.
Параллельно Google анонсировал, что Gemini 3.5 Pro появится «в следующем месяце» — судя по ценовой траектории, стоимость будет ещё выше.
Аналитика
Главный сигнал релиза — ценовой. Gemini 3.5 Flash стоит $1,50 за миллион входящих токенов и $9 за миллион исходящих. Это в 3 раза дороже Gemini 3 Flash Preview и в 6 раз дороже Gemini 3.1 Flash-Lite. Для сравнения, Gemini 3.1 Pro — $2/$12. То есть новый Flash почти вплотную подошёл к уровню Pro.
Данные Artificial Analysis делают картину нагляднее: прогон бенчмарка для Gemini 3.5 Flash (high) стоил $1 551,60 — против $892,28 для Gemini 3.1 Pro Preview. Flash обошёлся дороже Pro на реальных задачах. Для контекста: Claude Opus 4.7 (Adaptive Reasoning, Max Effort) — $5 117,14; GPT-5.5 (xhigh) — $3 357,00; GPT-5.5 (medium) — $1 199,14.
Это не изолированный случай. GPT-5.5 вышел в 2 раза дороже GPT-5.4, Claude Opus 4.7 — примерно в 1,46 раза дороже Opus 4.6. Все три крупных лаба синхронно проверяют ценовую толерантность своих API-клиентов. Примечательна другая деталь: Google разворачивает подорожавшую модель в бесплатные потребительские продукты — это либо инвестиция в качество UX, либо ставка на то, что enterprise-маржа перекроет потребительские расходы.
Кейсы применения в бизнесе
B2B-SaaS стартап на Gemini API. Если Flash-модели были основой агентских цепочек из-за низкой цены — пора пересчитать unit-экономику. При росте в 3–6x роутинг задач по моделям становится не оптимизацией, а необходимостью. Сложные запросы → 3.5 Flash или Pro, классификация и маршрутизация → Gemini 3.1 Flash-Lite. Разница в 6x по цене обычно оправдывает дополнительный routing-слой.
Корпорация с enterprise-контрактом Google. Gemini Enterprise Agent Platform — прямой путь к 3.5 Flash с корпоративными соглашениями по безопасности данных. Новый Interactions API в beta снижает инфраструктурную нагрузку: серверное хранение истории диалога особенно ценно для многошаговых workflow с большим числом turns. Стоит поставить его в очередь на тестирование уже сейчас, пока он в beta.
SMB и локальный бизнес в КР/СНГ. Для компаний, которые используют Gemini App или поиск в повседневной работе без API — изменение прозрачно: инструменты просто станут работать лучше. Если есть API-интеграция, бесплатный tier в AI Studio позволяет протестировать модель до принятия решения о масштабировании.
Кейсы в личной жизни
Разработчик. Попробуйте Interactions API в beta — серверная история упрощает архитектуру многоходовых агентов. Если у вас проекты на Flash-моделях, запустите стоимостный аудит: переход с 3.1 Flash-Lite на 3.5 Flash при тех же объёмах может означать рост затрат в 6 раз.
Контент-мейкер и исследователь. AI Mode в Google Search теперь работает на 3.5 Flash. Попробуйте формулировать более детальные и многоступенчатые запросы — модель лучше удерживает контекст. Миллион токенов контекста в AI Studio позволяет загружать объёмные документы для анализа целиком.
Студент или фрилансер. Gemini App — бесплатный вход в возможности модели без API-ключей. Для работы с кодом Android Studio теперь использует 3.5 Flash. AI Studio предлагает прямой API-доступ с бесплатным тиром, если хочется поэкспериментировать с промптами и посмотреть на реальный расход токенов.
Как применить сегодня
- Зайдите в Google AI Studio, выберите
gemini-3.5-flashи прогоните свой типичный промпт — смотрите на счётчик токенов, сравните с 3.1 Flash-Lite. - Проверьте реальную стоимость через Artificial Analysis — их бенчмарк учитывает reasoning-токены и даёт честное сравнение с Claude Sonnet 4.6, GPT-5.5 и другими актуальными моделями.
- Если у вас API-проект на Flash: протестируйте роутинг — простые задачи на Gemini 3.1 Flash-Lite, сложные на 3.5 Flash. Разница в 6x по цене почти всегда оправдывает routing-логику.
- Изучите Interactions API (beta) — если строите агентов с длинным диалогом, серверное хранение истории может упростить архитектуру и снизить объём передаваемых токенов.
- Следите за Gemini 3.5 Pro — Google обещает релиз в течение месяца. Судя по ценовому тренду линейки, стоимость будет выше 3.5 Flash: планируйте бюджет заранее.