#диффузионные LLM

Публикаций: 1

Nemotron Diffusion от NVIDIA: параллельная генерация и скорость в 6× быстрее AR

NVIDIA выпустила семейство диффузионных языковых моделей Nemotron-Labs Diffusion — 3B, 8B и 14B параметров с коммерческой лицензией. Главное отличие от обычных LLM: токены генерируются блоками параллельно и могут исправляться итеративно, а не фиксироваться навсегда.

← Все статьи