#Gemma

Публикаций: 4

DiffusionGemma: Google открыла диффузионный LLM с 500+ токенов/сек

Google тихо выпустила открытую версию своего диффузионного языкового движка — DiffusionGemma 26B с лицензией Apache 2. Это тот самый Gemini Diffusion, что год назад показал 857 токенов в секунду и тут же пропал с радаров.

Gemma 4 теперь влезает в телефон: Google DeepMind выпустила QAT-чекпоинты

Google DeepMind опубликовала QAT-чекпоинты для Gemma 4 — формат Q4_0 и новый мобильный вариант, которые радикально снижают потребление памяти при on-device инференсе. Граница между облачным и локальным ИИ становится тоньше.

Gemma 4 12B: мультимодальный ИИ умещается в 16 ГБ RAM

Google DeepMind выпустил Gemma 4 12B — открытую мультимодальную модель, которая работает с текстом, изображениями и аудио прямо на ноутбуке с 16 ГБ RAM и при этом почти не уступает модели вдвое большего размера.

Компактная Gemma-3 в роботе: 270М параметров управляют гусеницей и клешнёй

Разработчик с Хабра зафайнтюнил Gemma-3 270M от Google под управление гусеничным роботом с манипулятором в симуляторе MuJoCo — модель переводит текстовые команды в JSON-инструкции для актуаторов. Весь стек умещается на Raspberry Pi Zero 2 W и обучается бесплатно на Kaggle.

← Все статьи