Группа учёных из нескольких университетов воспроизвела Picbreeder — культовую платформу, где люди совместно «выводили» изображения через интерактивную эволюцию небольших нейросетей. Вместо людей в эксперимент поставили frontier-VLM. Вывод: качественная разница между человеческим и машинным поиском сохраняется даже у самых сильных современных моделей. Работа принята на GECCO 2026.
Контекст
Picbreeder появился в середине 2000-х как демонстрация того, что называется open-ended search — открытым поиском. Пользователи отбирали «родителей» среди сгенерированных изображений, эволюция двигалась вперёд без заранее заданной цели. Результатом стала библиотека визуальных форм с нарастающей сложностью — от простых паттернов до бабочек, черепов, лиц. Никакой финальной точки, никакого критерия «правильного ответа».
Это свойство — порождать бесконечный поток нового и значимого — считается фундаментальным для человеческого творчества, науки и технологий. Вопрос о том, могут ли AI-агенты воспроизвести его без внешнего руководства, стоит в центре дискуссии об автономном исследовательском ИИ.
Авторы работы — Sam Earle, Kay Arulkumaran, Andrew Dai, Akarsh Kumar, Julian Togelius, Sebastian Risi — заменили пользователей Picbreeder на современные Vision Language Models. Задача VLM: отбирать изображения в эволюционном цикле так, как это делали бы люди, стремясь к интересному и разнообразному.
Аналитика
Что именно пошло не так? Исследователи зафиксировали «очевидные качественные различия» между машинным и человеческим поиском — и попытались их измерить. Для этого использовались метрики филогенетической сложности (насколько разнообразна история происхождения изображений), а также визуальной и семантической новизны.
ИИ-агенты хорошо выполняли локальные шаги: выбирали «лучшее» из предложенного, следовали явным инструкциям. Но у них не возникало того, что авторы называют narrative momentum — нарративного импульса. Человек помнит, откуда пришёл, и это толкает его к неожиданным поворотам. VLM без памяти прошлых выборов дрейфует к усреднённому эстетически приятному результату, а не к подлинно новому.
Исследователи проверили три механизма коррекции: добавление исследовательского шума в процесс отбора, поведенческое разнообразие между агентами (аналог разных вкусов у разных людей) и явную память о предыдущих действиях. Каждый из этих факторов частично сокращал разрыв, но полностью закрыть его не удалось. Это говорит о том, что проблема не в параметрах одного агента — она структурная.
Кейсы применения в бизнесе
B2B-SaaS стартап с AI-фичами. Если вы строите генеративный продукт — дизайн-ассистент, копирайтинг-инструмент, генератор идей — результаты этой работы прямо применимы. Один LLM-агент будет конвергировать к «безопасному» среднему. Добавьте несколько агентов с разными параметрами sampling и явными ролевыми инструкциями (один оптимизирует новизну, другой — релевантность, третий — неожиданность). Это дешёвый способ реализовать behavioural diversity без переобучения моделей.
Корпорация с legacy-процессами. Многие крупные компании внедряют AI в brainsorming и R&D. Типичная ошибка — подавать агенту задачу без контекста предыдущих итераций. Механизм narrative momentum из статьи — это ровно то, что нужно встроить в корпоративный пайплайн: пусть агент видит историю сгенерированных идей и явно инструктирован «отличаться от уже предложенного». Это снижает дублирование и увеличивает охват пространства решений.
SMB и локальный бизнес в КР/СНГ. Небольшие студии, маркетинговые агентства и контент-команды часто используют одного AI-агента для генерации контента итерациями. Простое улучшение: сохраняйте историю запросов в системный промпт и добавляйте инструкцию «не повторяй подходы из предыдущих итераций». Это имитирует memory-механизм из исследования и даёт заметный прирост разнообразия без дополнительных затрат.
Кейсы в личной жизни
Разработчик, работающий с агентными системами. Если вы строите multi-agent pipeline, попробуйте явно задать разным агентам различающиеся «вкусы» через system prompt — один пессимистичный критик, другой экспериментатор, третий оптимизатор читаемости. Поведенческое разнообразие, которое исследователи вводили искусственно в Picbreeder, у вас уже есть в виде ролевых инструкций.
Контент-мейкер и дизайнер. Когда вы просите AI сгенерировать варианты — изображения, тексты, идеи для видео — вы уже интуитивно делаете то, что в статье называется interactive evolution: отбираете лучшее, просите продолжить. Добавьте один шаг: перед каждым новым раундом пересказывайте модели, что уже было отвергнуто и почему. Это и есть narrative momentum.
Студент или исследователь. Тема open-endedness в AI — активная область. Работы по Quality-Diversity алгоритмам (MAP-Elites, POET), Novelty Search и NEAT дают практический бэкграунд. Репозиторий авторов этой статьи открыт — это готовая база для дипломной работы или курсового проекта по evolutionary computation и LLM.
Как применить сегодня
- В любом генеративном пайплайне добавьте в системный промпт список уже отклонённых или уже использованных вариантов — это имитирует память и снижает конвергенцию к среднему.
- Запустите параллельно 2-3 агента с явно разными инструкциями по стилю или приоритетам, затем агрегируйте их выводы — дешёвая реализация behavioural diversity.
- Добавьте к selection-шагу небольшой случайный элемент: иногда выбирайте не «лучший», а «второй по качеству, но максимально непохожий на предыдущий» вариант.
- Следите за конференцией GECCO 2026 — там будут представлены финальные результаты этой работы плюс смежные исследования по evolutionary AI и open-endedness.
- Если интересна тема глубже — ищите по ключевым словам Quality-Diversity, open-ended learning, novelty search на arXiv и в Semantic Scholar.