Чем полезнее LLM — тем хуже она понимает людей
Масштабное исследование на 208 000 участников и 26 миллионах ответов зафиксировало парадокс: тренировка на полезность делает языковые модели хуже в симуляции человеческого поведения. Эффект накапливается с каждым поколением моделей.