#RLHF

Публикаций: 1

Чем полезнее LLM — тем хуже она понимает людей

Масштабное исследование на 208 000 участников и 26 миллионах ответов зафиксировало парадокс: тренировка на полезность делает языковые модели хуже в симуляции человеческого поведения. Эффект накапливается с каждым поколением моделей.

← Все статьи