#диффузионные модели

Публикаций: 2

DiffusionGemma: Google открыла диффузионный LLM с 500+ токенов/сек

Google тихо выпустила открытую версию своего диффузионного языкового движка — DiffusionGemma 26B с лицензией Apache 2. Это тот самый Gemini Diffusion, что год назад показал 857 токенов в секунду и тут же пропал с радаров.

Диффузия вместо перебора: нейросеть учит солверы не ошибаться

Исследователи предложили DiBS — гибрид диффузионной модели и классического символьного солвера для задач с жёсткими ограничениями. Тест на сложнейшем бенчмарке Судоку показал: нейросеть как «штурман» резко сокращает количество перебора и откатов.

← Все статьи