Google выпустил DiffusionGemma: текст из шума со скоростью 1000 токенов в секунду
Google открыл DiffusionGemma — 26-миллиардную модель, которая генерирует текст через диффузию, а не побуквенно. По данным Nvidia, на одном H100 она выдаёт около 1000 токенов в секунду — примерно в четыре раза быстрее сопоставимых авторегрессионных моделей.