#data-centric AI

Публикаций: 2

Качество данных важнее масштаба: Microsoft доказала это на практике

Microsoft Research выпустила Lens — модель генерации изображений на 3,8 млрд параметров, которая конкурирует с гигантами индустрии. Секрет не в размере, а в 800 миллионах детальных подписей, сгенерированных GPT-4.1.

Малые LLM не слабее — они просто забывают редкие задачи из-за частых

Исследователи нашли конкретный механизм, объясняющий, почему большие языковые модели умеют то, что маленьким не даётся. Оказалось, дело не в размере как таковом — а в том, как частые задачи вытесняют редкие из памяти модели.

← Все статьи