2026-06-18 02:01 · 🤖 AI World

Нейросеть из коз: исследователь Microsoft вскрыл баг AI-науки

Исследователь из Microsoft собрал работающую нейросеть из коз, мостов и ледяных пандусов в редакторе карт Age of Empires II. Это не мем — это методологический удар по половине современных AI-исследований.

Исследователь Microsoft взял редактор карт Age of Empires II и собрал в нём функциональную нейросеть: нейроны — козы, связи — мосты, активации — ледяные пандусы. Математика работает. Вывод неудобный: то, что мы называем «интеллектом» языковых моделей, во многом живёт не в весах, а в голове у исследователя, который смотрит на чат-интерфейс.

Контекст

Антропоморфизация в AI-науке — старая болезнь. Ещё в 1960-х Джозеф Вейценбаум создал ELIZA и был потрясён тем, как быстро люди начали проецировать на неё личность и намерения. Шестьдесят лет спустя проблема не исчезла — она масштабировалась. Языковые модели стали убедительнее, интерфейсы — человечнее, а критическая дистанция у части исследователей — короче.

Исследователь проанализировал 315 научных работ об LLM. Результат: больше половины изначально исходят из того, что у модели есть человекоподобные черты — ещё до того, как поставлен хоть один эксперимент. Это не вывод из данных. Это стартовая аксиома, которая затем «подтверждается» методологией, заточенной под неё же.

Age of Empires II здесь — идеальный инструмент деконструкции. Игра 1999 года, козы бродят по карте, никакого диалогового интерфейса. Математика нейросети та же самая. Но ощущения, что «с тобой разговаривает кто-то разумный», — ноль. Именно это ощущение и создаёт методологический шум в реальных исследованиях.

Аналитика

Проблема глубже, чем кажется на первый взгляд. Когда больше половины работ по LLM содержат встроенную антропоморфную предпосылку, это не просто академический изъян — это системный сдвиг в том, как индустрия понимает свой продукт. Компании строят roadmap на основе таких исследований. Инвесторы оценивают «AGI-proximity» через их выводы. Регуляторы пишут законы.

Эффект коз обнажает конкретный механизм: чат-интерфейс является конфаундером. Он создаёт иллюзию субъектности независимо от того, что происходит под капотом. Уберите интерфейс — и немедленно исчезает половина «доказательств» теории о разуме модели. Это не значит, что LLM не интересны или не мощны. Это значит, что значительная часть научных утверждений об их природе методологически несостоятельна.

Для AI-first бизнесов вывод прагматичный: не переносите академическую антропоморфизацию в продуктовые решения. Агент не «хочет» выполнить задачу. Он воспроизводит паттерн. Разница в архитектуре системы, в промптах, в fallback-логике — огромная.

Кейсы применения в бизнесе

B2B-SaaS стартап с AI-агентом в продукте. Если вы строите агента для клиентов и описываете его как «понимает контекст» или «думает как менеджер» — проверьте, не продаёте ли вы антропоморфную иллюзию. Сценарий: замените в презентации «агент понимает» на «агент воспроизводит паттерн на основе векторного поиска». Если продукт после этого звучит слабее — значит, часть ценностного предложения держалась на языке, а не на функциональности. Это риск для retention.

Корпорация, внедряющая LLM в внутренние процессы. Команды часто переоценивают надёжность модели именно из-за антропоморфного восприятия. Вариант: внедрить внутренний стандарт оценки — никаких «модель поняла задачу», только «модель вернула ответ с таким-то форматом и точностью на тестовой выборке». Снижает иллюзии, повышает качество промптов и SLA.

SMB и локальный бизнес в КР/СНГ. Небольшие компании часто покупают AI-инструменты под влиянием маркетинга, построенного на антропоморфизации. Практический шаг: перед покупкой любого AI-сервиса задать один вопрос вендору — «покажите бенчмарк на вашем типе задач, не на общем». Если вендор отвечает только нарративом про «умный ассистент» — это сигнал.

Кейсы в личной жизни

Разработчик. Когда Claude или GPT отвечает уверенно, но неправильно — это не «ошибка понимания», это статистический артефакт. Помогает другой фрейм при работе: «я получаю взвешенное продолжение текста, а не ответ от коллеги». Это меняет глубину проверки вывода — особенно в архитектурных решениях.

Контент-мейкер или журналист. Если вы используете LLM для исследования темы, антропоморфный фрейм опасен: кажется, что «модель знает». На практике: всегда верифицируйте конкретные факты, даты, имена из LLM-вывода через первоисточники. Модель коз тоже уверенно бродила бы по нужным клеткам.

Студент или исследователь. Если пишете работу с использованием LLM как инструмента — полезно явно обозначить в методологии, что модель использовалась для генерации гипотез/черновиков, а не как источник истины. Это не слабость — это научная честность, которой не хватает половине из тех 315 работ.

Как применить сегодня

Замените в своих промптах и документации глаголы «понимает», «думает», «решает» на «генерирует», «возвращает», «воспроизводит паттерн» — посмотрите, что изменится в ожиданиях команды.
Перед внедрением AI-инструмента в процесс: опишите его поведение без антропоморфных метафор. Если описание становится расплывчатым — функциональность, возможно, переоценена.
При чтении AI-исследований в прессе: проверяйте, является ли «модель проявила X» выводом из данных или стартовой аксиомой авторов.
Для команд с AI-агентами: добавьте в onboarding один слайд — «что агент делает» vs «что агент не делает». Снимает половину мифов до того, как они стали операционными ожиданиями.
Поищите оригинальную работу на arXiv или в блоге исследователя — разбор 315 статей с методологическим анализом стоит прочтения целиком.

«Замените чат-интерфейс бродящими козами — и математика не изменится, но ощущение, что вы разговариваете с кем-то, исчезнет.»

#AI-исследования #LLM #антропоморфизация #методология #Microsoft

← Все статьи