#мультиагенты

Публикаций: 6

PathoSage: AI-агент учится взвешивать доказательства, а не галлюцинировать

Мультимодальные LLM в медицинской патологии стабильно придумывают морфологические признаки и путаются при конфликтующих данных. PathoSage — трёхступенчатая агентная архитектура, где сбор и «судейство» доказательств разнесены по независимым стадиям, а финальный диагноз выносится в чистом контексте.

Четыре разных LLM в одном агентном совете — и это работает

Разработчик построил экономическую симуляцию, где каждый агент думает на модели от разного вендора — OpenAI, NVIDIA, OpenBMB и Qwen. Главный вывод: разнородность агентов создаёт настоящую экономику, а не разыгранный скрипт.

Медицинский тест для LLM: 7000 сценариев от поступления до выписки

Исследователи представили ClinicalMC — первый бенчмарк, проверяющий LLM не в одиночных клинических вопросах, а в полной цепочке госпитализации. Семь тысяч примеров, четыре стадии лечения, мультиагентная симуляция врача, пациента и экзаменатора.

Может ли ИИ творить бесконечно: VLM провалили тест на открытость

Исследователи взяли классический эксперимент с человеческим творчеством — Picbreeder — и заменили людей мощными мультимодальными моделями. Оказалось: ИИ генерирует, но не открывает.

5 агентов вместо дизайнера: как собрать контент-пайплайн на Claude Code

Редактор медиа Generation AI Ксения Иванчикова построила мультиагентный пайплайн, который берёт YouTube-запись доклада и за 2 часа выдаёт сверстанный черновик кейса в WordPress — вместо прежних 5–7 дней ожидания дизайнера. Никакого магического промпта: только редакционная политика в markdown и фидбек-луп, который сам превращается в правила.

30 секунд вместо 30 минут: RAG и мультиагенты в потоковой обработке

Команда СберТеха автоматизировала генерацию конфигураций для потоковой обработки данных — инженер описывает задачу на естественном языке и за 30 секунд получает готовый файл вместо часов с документацией. Под капотом — RAG, векторная база данных и два агента, общающихся по протоколу A2A.

← Все статьи