← Все статьи
2026-05-21 16:01 · 🤖 AI World

Gemini 3.5 Flash теперь в терминале — llm-gemini 0.32

Плагин llm-gemini обновился до версии 0.32 и добавил поддержку Gemini 3.5 Flash — новой модели Google, которую компания планирует использовать повсеместно. Теперь быстрый доступ к ней прямо из командной строки.

Gemini 3.5 Flash теперь в терминале — llm-gemini 0.32

19 мая 2026 года Саймон Уиллисон выпустил llm-gemini 0.32 — плагин для его open-source CLI-инструмента llm, который теперь поддерживает модель Gemini 3.5 Flash. Это небольшой релиз с одним новым идентификатором модели, но за ним стоит интересный контекст: Google позиционирует Gemini 3.5 Flash как дороже предшественника, при этом планируя запустить её «везде».

Контекст

Инструмент llm — это CLI и Python-библиотека от Саймона Уиллисона, один из наиболее удобных способов работать с языковыми моделями напрямую из терминала или скриптов. Поддерживает десятки провайдеров через систему плагинов: OpenAI, Anthropic, Mistral, Ollama, и — через llm-gemini — Google. Инструмент особенно популярен среди разработчиков, которые хотят быстро тестировать модели, строить пайплайны в bash или интегрировать LLM в Python без тяжёлых фреймворков.

Gemini 3.5 Flash — новое поколение «быстрой» линейки Google. По имеющимся данным, модель дороже предыдущих Flash-версий, но Google, судя по всему, намерена использовать её как основу для широкого спектра собственных продуктов и API-интеграций. Это сигнал: быстрые, недорогие (относительно Gemini Ultra/Pro) модели становятся de facto рабочей лошадкой экосистемы. Тот же путь прошли GPT-4o mini и Claude Haiku — «дешёвые» модели оказались самыми популярными по объёму запросов.

Плагинная архитектура llm позволяет получить доступ к новой модели буквально одной командой: llm install llm-gemini и затем llm -m gemini-3.5-flash "твой запрос". Уиллисон даже нарисовал пеликана с помощью этого обновления — что-то вроде традиционного «hello world» в его блоге для проверки мультимодальности.

Аналитика

Интересна сама закономерность: каждый раз, когда Google или Anthropic выпускают новую модель, open-source экосистема инструментов (llm, LiteLLM, LangChain, RouteLLM) подхватывает её через несколько часов или дней. Это создаёт реальную конкуренцию на уровне developer experience — разработчику не нужно переписывать интеграцию под каждого провайдера. Достаточно обновить плагин.

Рост цены Gemini 3.5 Flash по сравнению с предыдущими Flash-моделями — осознанная стратегия. Google движется в сторону «дорогой, но быстрой и умной» Flash вместо «дешёвой, но ограниченной». Это сближает Flash с позицией, которую занимает Claude Sonnet или GPT-4o: не самая мощная модель, но рабочая для большинства задач. Для разработчиков это означает, что выбор «Flash против Pro» теперь не такой очевидный — придётся считать.

Для AI-first команд, которые уже используют llm в скриптах автоматизации, деплоя, обработки данных — обновление плагина даёт мгновенный доступ к новой модели без изменения кода. Это и есть ценность хорошей абстракции: инфраструктура не меняется, меняется только идентификатор модели.

Кейсы применения в бизнесе

B2B-SaaS стартап: если в пайплайне уже есть llm или LiteLLM для классификации тикетов, суммаризации или генерации черновиков — добавить Gemini 3.5 Flash как альтернативный провайдер займёт час. Полезно для A/B-тестирования качества ответов: запускаешь один и тот же промпт через Claude Haiku, GPT-4o mini и Gemini 3.5 Flash, сравниваешь результаты и цену. Выигрывает тот, кто не привязался к одному провайдеру.

Корпорация с legacy-инфраструктурой: Google активно продвигает Gemini в enterprise через Workspace и Vertex AI. Если компания уже на Google Cloud, Gemini 3.5 Flash — логичный выбор для внутренних инструментов: суммаризация встреч, автоответы в поддержке, генерация отчётов. Плагин llm — способ быстро прототипировать такие инструменты до полноценной интеграции в Vertex.

SMB в КР/СНГ: для небольших команд, которые ищут доступную альтернативу ChatGPT Plus — Gemini API с Flash-моделью остаётся одним из наиболее доступных вариантов с API-доступом. Llm CLI позволяет строить простые автоматизации без написания полноценного бэкенда: скрипт, cron, готово.

Кейсы в личной жизни

Разработчик: установить llm и llm-gemini, добавить API-ключ Google — и получить универсальный терминальный ассистент. Можно трубить вывод любой команды в модель: git diff | llm -m gemini-3.5-flash "объясни изменения". Быстро, без открытия браузера.

Контент-мейкер: использовать llm в скриптах для пакетной обработки текста — перефразирование, перевод, генерация вариантов заголовков. Gemini 3.5 Flash быстро обрабатывает большие объёмы, что важно при работе с длинными транскриптами или сценариями.

Студент или фрилансер: llm — хороший способ познакомиться с разными моделями не через веб-интерфейс, а через код. Можно сравнивать ответы моделей на одни и те же запросы, строить собственные инструменты, понимать разницу между провайдерами — без необходимости платить за несколько подписок.

Как применить сегодня

  • Установить llm: pip install llm, затем плагин: llm install llm-gemini
  • Добавить API-ключ Google AI Studio командой llm keys set gemini
  • Протестировать модель: llm -m gemini-3.5-flash "кратко объясни разницу между RAG и fine-tuning"
  • Сравнить качество и стоимость с текущим провайдером на реальных задачах из вашего пайплайна
  • Следить за блогом Саймона Уиллисона — он одним из первых тестирует новые модели и публикует практические наблюдения
← Все статьи