2026-06-13 22:01 · 🤖 AI World

Gemini-SQL2 оставил GPT и Claude позади в гонке text-to-SQL

Google Research выпустила Gemini-SQL2 — систему, которая переводит обычный вопрос на естественном языке в готовый SQL-запрос. На бенчмарке BIRD она набрала 80.04% точности и обошла решения OpenAI и Anthropic с заметным отрывом.

Google Research анонсировала Gemini-SQL2 — специализированную систему text-to-SQL, построенную на базе Gemini 3.1 Pro. На публичном бенчмарке BIRD она достигла 80.04% точности, опередив конкурирующие решения от OpenAI и Anthropic. Google рассматривает технологию как основу для улучшения интерфейсов на естественном языке в своих дата-сервисах.

Контекст

Text-to-SQL — одна из старейших задач в NLP, но именно сейчас она переживает новую волну интереса. Бизнес хочет, чтобы аналитику мог делать любой сотрудник, не только тот, кто умеет писать JOIN и GROUP BY. BIRD (Benchmark for Instruction-following Relational Databases) — один из самых требовательных открытых тестов в этой нише: он проверяет не просто синтаксически корректный SQL, а семантически точный запрос к реальным, «грязным» схемам данных.

До Gemini-SQL2 лучшие результаты на BIRD показывали системы на базе GPT-4-класса моделей и специализированные агентные пайплайны. 80.04% — это не просто первое место в таблице, это качественный сдвиг: прежний потолок для большинства систем держался в диапазоне 70–75%, и пробить его без многошаговых агентных цепочек не удавалось.

Важно, что Google не публикует Gemini-SQL2 как отдельный продукт — это исследовательская система, нацеленная на интеграцию в BigQuery, Looker и другие дата-инструменты Google Cloud. То есть речь идёт об инфраструктурном улучшении, а не о новой точке входа для конечного пользователя.

Аналитика

Text-to-SQL уже несколько лет считается «почти решённой» задачей — и всё равно каждый год появляется новый лидер бенчмарка. Разница между нынешним состоянием и «реально работает в продакшене» огромная: реальные схемы данных хаотичны, у таблиц нет внятных названий, бизнес-логика живёт в головах аналитиков, а не в документации. Gemini-SQL2, судя по описанию, делает ставку именно на работу с такими «несовершенными» схемами — и это ценно.

Второй важный момент: Google интегрирует результат не в чат-бот, а в дата-инфраструктуру. Это меняет логику конкуренции. Если Anthropic и OpenAI борются за API-долю через универсальные модели, Google встраивает специализированный intelligence прямо в среду, где данные уже живут. Это стратегия «AI внутри трубы», а не «AI как новый интерфейс».

Для рынка это сигнал: вертикальные, задачно-ориентированные модели (не общие LLM, а fine-tuned под конкретную задачу на мощном основании) начинают системно обгонять универсальные решения в измеримых метриках. RAG + prompt engineering больше не панацея — если у конкурента есть специализированная обученная система, разрыв будет измеримым.

Кейсы применения в бизнесе

B2B-SaaS стартап с продуктовой аналитикой. Команда из 10 человек, аналитик один. Внедрение text-to-SQL (через BigQuery + Looker или через open-source аналоги вроде Vanna.ai) позволяет product manager-у самому задавать вопросы к данным на русском языке — «покажи конверсию из триала в платный за последние 30 дней по каналам» — и получать готовый результат без тикета аналитику. Экономия: 3–5 часов аналитика в неделю, ускорение цикла product decision с дней до минут.

Корпорация с legacy-базами данных. Исторически данные хранятся в Oracle или MSSQL со схемами, которые никто не документировал. Text-to-SQL с хорошей моделью позволяет построить семантический слой поверх этих баз — описать таблицы на понятном языке, обучить систему на типичных запросах, и выдать бизнес-пользователям интерфейс в духе «спроси базу». Сценарий уже реализуется в enterprise-инсталляциях Databricks SQL AI и аналогах.

SMB и локальный бизнес в КР/СНГ. Небольшой ритейл или логистика с данными в PostgreSQL и без штатного аналитика. Сегодня это решается через Excel-выгрузки и ручной анализ. Text-to-SQL-обёртка над своей базой (например, через open-source Vanna или self-hosted решения на базе Qwen или DeepSeek) снижает барьер до уровня «написать вопрос директору по продажам в мессенджере» — только директор пишет в чат-бот, а не в мессенджер.

Кейсы в личной жизни

Разработчик. При прототипировании нового сервиса можно описать схему базы словами и попросить модель написать все базовые CRUD-запросы, индексы и аналитические выборки. Gemini-SQL2 или его аналоги ускоряют фазу «набросок схемы → первые рабочие запросы» с часов до минут. Особенно актуально, если работаешь с незнакомой СУБД.

Контент-мейкер и исследователь. Публичные датасеты (данные по рынку труда, статистика по стартапам, открытые данные Нацстата КР) лежат в CSV или SQLite. Text-to-SQL позволяет задать вопрос на естественном языке и получить готовую таблицу для инфографики или статьи — без знания SQL вообще.

Студент или джун. Text-to-SQL работает в обе стороны: можно написать запрос и попросить объяснить, что он делает, или описать задачу и посмотреть, как её правильно решить через SQL. Это интерактивный тренажёр, который не просто даёт ответ, а показывает паттерн мышления.

Как применить сегодня

Если вы на Google Cloud — проверьте возможности BigQuery ML и Gemini in BigQuery: text-to-SQL там уже встроен и будет улучшаться по мере интеграции Gemini-SQL2.
Для self-hosted или нейтрального стека — попробуйте Vanna.ai (open-source, Python, подключается к любой СУБД): за вечер можно поднять рабочий прототип на своей базе.
Если используете Claude или GPT через API — добавьте в system prompt полную схему вашей базы (таблицы, колонки, типы, примеры значений) и задавайте вопросы на русском: качество резко вырастет без специализированной системы.
Для команд без аналитика — оцените Metabase с AI-функциями или Superset: оба инструмента добавляют NL-интерфейс поверх существующих подключений к БД.
Следите за open-source аналогами на базе Qwen и DeepSeek: community уже обучает text-to-SQL модели на русскоязычных схемах, и через несколько месяцев появятся production-ready варианты без зависимости от Google или OpenAI.

Text-to-SQL — это не про то, чтобы «не учить SQL». Это про то, чтобы скорость получения ответа из данных перестала зависеть от узкого специалиста.

#text-to-SQL #Google #Gemini #аналитика данных #LLM

← Все статьи