#оптимизация

Публикаций: 3

Transformer обучили на мини-задаче — он сам взял промышленный масштаб

Transformer-модель, обученная на производственных расписаниях размером до 10×10, без дополнительного обучения решает задачи 100×100 с отклонением 12–15% от теоретического минимума. Это не идеально — но это работает без переобучения при смене масштаба.

Почему оптимальный план ИИ рассыпается в реальности

Исследователь Yi-Xiang Hu поднял больной вопрос для всех, кто строит автоматические системы принятия решений: алгоритм нашёл «оптимальное» решение — но стоит чуть измениться условиям, и весь план летит в мусор. Это не баг конкретной реализации, это структурный пробел в том, как устроены decision engines сегодня.

Токены, веса и автокомплит на стероидах: как LLM видит ваш текст

Русский текст обходится в 2–3 раза дороже английского — и это не баг тарификации, а следствие того, как модели буквально «видят» слова. Разбираем архитектуру LLM изнутри: токены, веса, BPE и почему всё это важно для тех, кто строит на них продукты.

← Все статьи