2026-05-31 18:01 · 🤖 AI World

Epicure: один вопрос про курицу — два разных ответа от ИИ

Лондонский стартап Kaikaku.AI обучил три разные модели на рецептах и молекулах — и получил три принципиально разных ответа на один вопрос. Это не просто кулинарный эксперимент: это демонстрация того, как источник данных полностью меняет природу знания модели.

Kaikaku.AI выпустила семейство моделей под названием Epicure — первый публично описанный случай, когда кулинарный ИИ явно разделяет два типа знания: что сочетается в рецептах и что совместимо на уровне химии. Обучающий корпус — 4,14 миллиона рецептов на семи языках плюс база вкусовых соединений FlavorDB. Каждый из трёх вариантов модели возвращает разные рекомендации — и это не баг, а суть проекта.

Контекст

Идея молекулярного food pairing появилась задолго до LLM. Heston Blumenthal популяризировал принцип: ингредиенты с общими ароматическими соединениями хорошо сочетаются, даже если культурно они далеки друг от друга. Шоколад и голубой сыр, белый трюфель и яйцо — не интуиция, а химия. Проблема в том, что рецептурные базы данных кодируют культурные привычки, а не молекулярную реальность. Когда вы спрашиваете GPT или любую другую модель, что идёт к курице, она отвечает на основе паттернов из миллионов кулинарных текстов — то есть говорит вам то, что обычно готовят, а не то, что химически совместимо.

Kaikaku.AI явно расщепила эти два знания. Модель, обученная только на химии FlavorDB, не видела рецептов вообще — и всё равно оказалась способна предсказывать вкусовые профили и питательные характеристики лучше, чем рецептурные альтернативы. Это классический пример emergent behaviour: модель извлекла знание, которого в обучающих данных явно не было.

Рынок food tech и culinary AI пока невелик, но плотно конкурентен — стартапы вроде Spoonacular, Yummly (куплен Whirlpool) и академические проекты типа FlavorGraph давно работают с этой темой. Epicure отличается тем, что делает выбор источника знания явным и управляемым.

Аналитика

Главный инсайт здесь не про еду. Это демонстрация того, что источник данных — это встроенная точка зрения модели. Модель, обученная на рецептах из Instagram и кулинарных блогов, знает, что принято. Модель, обученная на молекулах, знает, что работает. Это фундаментально разные системы знаний, и смешивать их без разметки — значит получать ответы, природу которых нельзя проверить.

Для AI-first продуктов это прямой урок: если ваш RAG или fine-tuned агент отвечает на вопросы в какой-то домене, стоит задуматься, что именно лежит в корпусе. Корпоративные документы кодируют политику и прецедент, а не объективные истины. Научные статьи кодируют исследовательские традиции. Ни один источник не нейтрален — и это нужно проектировать явно, а не скрывать за «умным поиском».

Отдельно интересен факт, что химическая модель без явного supervise-сигнала научилась классифицировать вкус и питательность лучше рецептурных. Это говорит о том, что молекулярная структура является более богатым и информативным сигналом, чем текстовые описания блюд. Похожий паттерн наблюдается в медицине: модели на молекулярных данных часто обходят модели на клинических записях в задачах, где клинические записи исторически доминировали.

Кейсы применения в бизнесе

B2B-SaaS стартап в foodtech или HoReCa-автоматизации: если вы строите рекомендательную систему для ресторана или сервиса доставки, разделение «культурной» и «химической» совместимости позволяет предлагать не только «популярные» сочетания, но и нетривиальные — те, которые работают вкусово, но ещё не стали мейнстримом. Это USP для шеф-поваров, которым нужна не автоматизация шаблонов, а реальная креативная поддержка.

Корпорация с legacy-данными: паттерн Epicure переносится в любой домен с разнородными источниками. Если у вас есть и операционные логи, и экспертные базы знаний, и клиентские отзывы — обучать единую модель на всём сразу означает смешивать несовместимые типы истины. Архитектура с явным разделением источников и маршрутизацией запросов по типу знания — это инфраструктурное решение, применимое в юриспруденции, медицине, финансах.

SMB / локальный бизнес в КР и СНГ: для небольшого ресторана или службы кейтеринга практический вывод проще. Если вы используете ИИ-инструменты для составления меню или ответов клиентам — проверьте, на каких данных они обучены. Рекомендации «что подать к блюду» от общей LLM будут европоцентричными и рецептурно-банальными. Специализированная модель или хотя бы тщательно составленный промпт с учётом локальной кухни даст значительно более релевантный результат.

Кейсы в личной жизни

Разработчик / ML-инженер: используйте Epicure как кейс-стади при проектировании RAG-систем. Когда клиент или менеджер говорит «добавь в базу все документы», — покажите этот пример: разные источники дают принципиально разные типы знания, и их смешение без явной маршрутизации снижает качество ответов. Это сильный аргумент для архитектурного разговора.

Контент-мейкер / кулинарный блогер: попробуйте поэкспериментировать с FlavorDB как источником идей для нестандартного контента. «Молекулярные сочетания, которые нарушают правила» — сильный формат, и за ним стоит реальная наука, а не выдумка. Это повышает доверие аудитории.

Студент / исследователь: тема пересечения пищевой химии и ML практически не покрыта на русском языке. Если вы ищете нишу для дипломной или курсовой — food pairing + embeddings + FlavorDB — это реальная исследовательская задача с готовой публичной базой данных и минимальной конкуренцией в русскоязычном академическом пространстве.

Как применить сегодня

Если вы строите RAG или fine-tuned агента — явно размечайте источники данных по типу знания: прецедент, политика, наука, пользовательский контент. Не смешивайте без маршрутизации.
Проверьте FlavorDB — это открытая база ароматических соединений продуктов, пригодная для экспериментов без лицензионных ограничений.
При работе с любым доменным ИИ-инструментом задайте себе вопрос: «на чём это обучено — на практике или на теории?» Ответ определяет, когда инструменту можно доверять, а когда — нет.
Для кулинарных или потребительских рекомендаций протестируйте один и тот же запрос в общей LLM и в специализированном инструменте — разница часто неожиданно велика.
Следите за Kaikaku.AI: если они откроют API или опубликуют веса, это станет редким примером специализированной food-модели с явной интерпретируемостью источника знания.

#food AI #embeddings #молекулярная гастрономия #RAG #data sourcing

← Все статьи