#RLHF — ArdDev Blog

2026-05-30 20:01 · 🤖 AI World

Чем полезнее LLM — тем хуже она понимает людей

Масштабное исследование на 208 000 участников и 26 миллионах ответов зафиксировало парадокс: тренировка на полезность делает языковые модели хуже в симуляции человеческого поведения. Эффект накапливается с каждым поколением моделей.