← Все статьи
2026-05-21 18:02 · 🤖 AI World

Gemini 3.5 Flash вышел GA и уже у миллиардов — но стал втрое дороже

Google выпустил Gemini 3.5 Flash на Google I/O сразу в общей доступности — без preview-статуса, одновременно для потребителей, разработчиков и Enterprise. Модель в 3–6 раз дороже предыдущих Flash, но Google разворачивает её буквально везде.

Gemini 3.5 Flash вышел GA и уже у миллиардов — но стал втрое дороже

19 мая 2026 года на Google I/O вышел Gemini 3.5 Flash — сразу в GA, без промежуточного preview. Google развернул его одновременно: Gemini App, AI Mode в Google Search, Gemini API, AI Studio, Android Studio, платформа Google Antigravity и корпоративный Gemini Enterprise Agent Platform. Контекст: 1 048 576 токенов на вход, 65 536 на выход. Срез знаний — январь 2025. Функция computer use в релиз не вошла.

Контекст

Flash-линейка у Google — это «быстрые и доступные» модели напротив Pro-серии. До 3.5 Flash были Gemini 3 Flash Preview и Gemini 3.1 Flash-Lite: именно на них строились высоконагруженные агентские пайплайны, где стоимость вывода критична. Теперь Google добавил новый Interactions API (beta) — серверное управление историей диалога. По структуре это их ответ на OpenAI Responses API: сессионное состояние хранится на стороне Google, разработчику не нужно передавать историю вручную.

Независимое агентство Artificial Analysis считает реальную стоимость прогона своего бенчмарка с учётом токенизации и reasoning-токенов — это честнее, чем просто смотреть на прайс-лист. Их цифры по новому релизу показательны.

Параллельно Google анонсировал, что Gemini 3.5 Pro появится «в следующем месяце» — судя по ценовой траектории, стоимость будет ещё выше.

Аналитика

Главный сигнал релиза — ценовой. Gemini 3.5 Flash стоит $1,50 за миллион входящих токенов и $9 за миллион исходящих. Это в 3 раза дороже Gemini 3 Flash Preview и в 6 раз дороже Gemini 3.1 Flash-Lite. Для сравнения, Gemini 3.1 Pro — $2/$12. То есть новый Flash почти вплотную подошёл к уровню Pro.

Данные Artificial Analysis делают картину нагляднее: прогон бенчмарка для Gemini 3.5 Flash (high) стоил $1 551,60 — против $892,28 для Gemini 3.1 Pro Preview. Flash обошёлся дороже Pro на реальных задачах. Для контекста: Claude Opus 4.7 (Adaptive Reasoning, Max Effort) — $5 117,14; GPT-5.5 (xhigh) — $3 357,00; GPT-5.5 (medium) — $1 199,14.

Это не изолированный случай. GPT-5.5 вышел в 2 раза дороже GPT-5.4, Claude Opus 4.7 — примерно в 1,46 раза дороже Opus 4.6. Все три крупных лаба синхронно проверяют ценовую толерантность своих API-клиентов. Примечательна другая деталь: Google разворачивает подорожавшую модель в бесплатные потребительские продукты — это либо инвестиция в качество UX, либо ставка на то, что enterprise-маржа перекроет потребительские расходы.

Кейсы применения в бизнесе

B2B-SaaS стартап на Gemini API. Если Flash-модели были основой агентских цепочек из-за низкой цены — пора пересчитать unit-экономику. При росте в 3–6x роутинг задач по моделям становится не оптимизацией, а необходимостью. Сложные запросы → 3.5 Flash или Pro, классификация и маршрутизация → Gemini 3.1 Flash-Lite. Разница в 6x по цене обычно оправдывает дополнительный routing-слой.

Корпорация с enterprise-контрактом Google. Gemini Enterprise Agent Platform — прямой путь к 3.5 Flash с корпоративными соглашениями по безопасности данных. Новый Interactions API в beta снижает инфраструктурную нагрузку: серверное хранение истории диалога особенно ценно для многошаговых workflow с большим числом turns. Стоит поставить его в очередь на тестирование уже сейчас, пока он в beta.

SMB и локальный бизнес в КР/СНГ. Для компаний, которые используют Gemini App или поиск в повседневной работе без API — изменение прозрачно: инструменты просто станут работать лучше. Если есть API-интеграция, бесплатный tier в AI Studio позволяет протестировать модель до принятия решения о масштабировании.

Кейсы в личной жизни

Разработчик. Попробуйте Interactions API в beta — серверная история упрощает архитектуру многоходовых агентов. Если у вас проекты на Flash-моделях, запустите стоимостный аудит: переход с 3.1 Flash-Lite на 3.5 Flash при тех же объёмах может означать рост затрат в 6 раз.

Контент-мейкер и исследователь. AI Mode в Google Search теперь работает на 3.5 Flash. Попробуйте формулировать более детальные и многоступенчатые запросы — модель лучше удерживает контекст. Миллион токенов контекста в AI Studio позволяет загружать объёмные документы для анализа целиком.

Студент или фрилансер. Gemini App — бесплатный вход в возможности модели без API-ключей. Для работы с кодом Android Studio теперь использует 3.5 Flash. AI Studio предлагает прямой API-доступ с бесплатным тиром, если хочется поэкспериментировать с промптами и посмотреть на реальный расход токенов.

Как применить сегодня

  • Зайдите в Google AI Studio, выберите gemini-3.5-flash и прогоните свой типичный промпт — смотрите на счётчик токенов, сравните с 3.1 Flash-Lite.
  • Проверьте реальную стоимость через Artificial Analysis — их бенчмарк учитывает reasoning-токены и даёт честное сравнение с Claude Sonnet 4.6, GPT-5.5 и другими актуальными моделями.
  • Если у вас API-проект на Flash: протестируйте роутинг — простые задачи на Gemini 3.1 Flash-Lite, сложные на 3.5 Flash. Разница в 6x по цене почти всегда оправдывает routing-логику.
  • Изучите Interactions API (beta) — если строите агентов с длинным диалогом, серверное хранение истории может упростить архитектуру и снизить объём передаваемых токенов.
  • Следите за Gemini 3.5 Pro — Google обещает релиз в течение месяца. Судя по ценовому тренду линейки, стоимость будет выше 3.5 Flash: планируйте бюджет заранее.
← Все статьи