Google Research анонсировала Gemini-SQL2 — специализированную систему text-to-SQL, построенную на базе Gemini 3.1 Pro. На публичном бенчмарке BIRD она достигла 80.04% точности, опередив конкурирующие решения от OpenAI и Anthropic. Google рассматривает технологию как основу для улучшения интерфейсов на естественном языке в своих дата-сервисах.
Контекст
Text-to-SQL — одна из старейших задач в NLP, но именно сейчас она переживает новую волну интереса. Бизнес хочет, чтобы аналитику мог делать любой сотрудник, не только тот, кто умеет писать JOIN и GROUP BY. BIRD (Benchmark for Instruction-following Relational Databases) — один из самых требовательных открытых тестов в этой нише: он проверяет не просто синтаксически корректный SQL, а семантически точный запрос к реальным, «грязным» схемам данных.
До Gemini-SQL2 лучшие результаты на BIRD показывали системы на базе GPT-4-класса моделей и специализированные агентные пайплайны. 80.04% — это не просто первое место в таблице, это качественный сдвиг: прежний потолок для большинства систем держался в диапазоне 70–75%, и пробить его без многошаговых агентных цепочек не удавалось.
Важно, что Google не публикует Gemini-SQL2 как отдельный продукт — это исследовательская система, нацеленная на интеграцию в BigQuery, Looker и другие дата-инструменты Google Cloud. То есть речь идёт об инфраструктурном улучшении, а не о новой точке входа для конечного пользователя.
Аналитика
Text-to-SQL уже несколько лет считается «почти решённой» задачей — и всё равно каждый год появляется новый лидер бенчмарка. Разница между нынешним состоянием и «реально работает в продакшене» огромная: реальные схемы данных хаотичны, у таблиц нет внятных названий, бизнес-логика живёт в головах аналитиков, а не в документации. Gemini-SQL2, судя по описанию, делает ставку именно на работу с такими «несовершенными» схемами — и это ценно.
Второй важный момент: Google интегрирует результат не в чат-бот, а в дата-инфраструктуру. Это меняет логику конкуренции. Если Anthropic и OpenAI борются за API-долю через универсальные модели, Google встраивает специализированный intelligence прямо в среду, где данные уже живут. Это стратегия «AI внутри трубы», а не «AI как новый интерфейс».
Для рынка это сигнал: вертикальные, задачно-ориентированные модели (не общие LLM, а fine-tuned под конкретную задачу на мощном основании) начинают системно обгонять универсальные решения в измеримых метриках. RAG + prompt engineering больше не панацея — если у конкурента есть специализированная обученная система, разрыв будет измеримым.
Кейсы применения в бизнесе
B2B-SaaS стартап с продуктовой аналитикой. Команда из 10 человек, аналитик один. Внедрение text-to-SQL (через BigQuery + Looker или через open-source аналоги вроде Vanna.ai) позволяет product manager-у самому задавать вопросы к данным на русском языке — «покажи конверсию из триала в платный за последние 30 дней по каналам» — и получать готовый результат без тикета аналитику. Экономия: 3–5 часов аналитика в неделю, ускорение цикла product decision с дней до минут.
Корпорация с legacy-базами данных. Исторически данные хранятся в Oracle или MSSQL со схемами, которые никто не документировал. Text-to-SQL с хорошей моделью позволяет построить семантический слой поверх этих баз — описать таблицы на понятном языке, обучить систему на типичных запросах, и выдать бизнес-пользователям интерфейс в духе «спроси базу». Сценарий уже реализуется в enterprise-инсталляциях Databricks SQL AI и аналогах.
SMB и локальный бизнес в КР/СНГ. Небольшой ритейл или логистика с данными в PostgreSQL и без штатного аналитика. Сегодня это решается через Excel-выгрузки и ручной анализ. Text-to-SQL-обёртка над своей базой (например, через open-source Vanna или self-hosted решения на базе Qwen или DeepSeek) снижает барьер до уровня «написать вопрос директору по продажам в мессенджере» — только директор пишет в чат-бот, а не в мессенджер.
Кейсы в личной жизни
Разработчик. При прототипировании нового сервиса можно описать схему базы словами и попросить модель написать все базовые CRUD-запросы, индексы и аналитические выборки. Gemini-SQL2 или его аналоги ускоряют фазу «набросок схемы → первые рабочие запросы» с часов до минут. Особенно актуально, если работаешь с незнакомой СУБД.
Контент-мейкер и исследователь. Публичные датасеты (данные по рынку труда, статистика по стартапам, открытые данные Нацстата КР) лежат в CSV или SQLite. Text-to-SQL позволяет задать вопрос на естественном языке и получить готовую таблицу для инфографики или статьи — без знания SQL вообще.
Студент или джун. Text-to-SQL работает в обе стороны: можно написать запрос и попросить объяснить, что он делает, или описать задачу и посмотреть, как её правильно решить через SQL. Это интерактивный тренажёр, который не просто даёт ответ, а показывает паттерн мышления.
Как применить сегодня
- Если вы на Google Cloud — проверьте возможности BigQuery ML и Gemini in BigQuery: text-to-SQL там уже встроен и будет улучшаться по мере интеграции Gemini-SQL2.
- Для self-hosted или нейтрального стека — попробуйте Vanna.ai (open-source, Python, подключается к любой СУБД): за вечер можно поднять рабочий прототип на своей базе.
- Если используете Claude или GPT через API — добавьте в system prompt полную схему вашей базы (таблицы, колонки, типы, примеры значений) и задавайте вопросы на русском: качество резко вырастет без специализированной системы.
- Для команд без аналитика — оцените Metabase с AI-функциями или Superset: оба инструмента добавляют NL-интерфейс поверх существующих подключений к БД.
- Следите за open-source аналогами на базе Qwen и DeepSeek: community уже обучает text-to-SQL модели на русскоязычных схемах, и через несколько месяцев появятся production-ready варианты без зависимости от Google или OpenAI.
Text-to-SQL — это не про то, чтобы «не учить SQL». Это про то, чтобы скорость получения ответа из данных перестала зависеть от узкого специалиста.