#мультиагенты

Публикаций: 12

2026-07-23 06:26 · 🤖 AI World

Агенты без отделов: что показал benchmark 45 биотех-кейсов

Исследователь Yinan Wang опубликовал на arXiv работу с неудобным вопросом: если AI-нативная компания строится из агентов — зачем ей копировать человеческий оргчарт? Benchmark из 45 ретроспективных биотех-кейсов показывает: архитектура с общей моделью «актив → ценность» обходит имитацию отделов — с важными оговорками.

2026-07-23 06:09 · 🤖 AI World

MAGE: мультиагентный AI расставляет блоки чипов лучше людей

Команда исследователей представила MAGE — агентный фреймворк, который автоматически размещает макросы в дизайне микросхем и превосходит опытных инженеров по ключевым тайминговым показателям на 18–73%. Работа опубликована на arXiv 20 июля 2026 года.

2026-07-14 10:02 · 🤖 AI World

DoorDash раскрыл, как жюри из нескольких LLM маркирует миллионы блюд

Инженеры DoorDash описали систему автоматической разметки пищевых метаданных, где несколько языковых моделей голосуют по каждой позиции меню — и консенсус жюри стабильно точнее одиночного LLM-вызова. Подход сочетает оптимизацию контекста с мультимодальным ИИ: фото блюда работает как отдельный сигнал наравне с текстом.

2026-07-09 06:07 · 🤖 AI World

GPT-Live: голосовой AI наконец умеет думать во время разговора

OpenAI выпустила GPT-Live — новую модель голосового режима ChatGPT. Пока вы говорите, она делегирует сложные запросы GPT-5.5 в фоне и возвращает ответ без пауз в разговоре.

2026-06-30 17:47 · 🤖 AI World

Clarus: как ИИ-агенты учатся делать науку командой

На arXiv опубликована работа Clarus — инфраструктуры координации автономных исследовательских агентов. Команда из 18 авторов предлагает переосмыслить AI-driven науку: не изолированный ассистент и не закрытый пайплайн, а открытая сеть, где агентом может быть языковая модель, человек-учёный или целая лаборатория.

2026-06-28 14:06 · 🤖 AI World

Reasoning сжимается хорошо — факты нет: что доказал VibeThinker-3B

Модель с 3 миллиардами параметров наравне бьётся с DeepSeek V3.2 и Kimi K2.5 на математике и коде — хотя те в 333 раза больше. Секрет не в размере, а в том, что именно вообще поддаётся сжатию.

2026-06-09 10:02 · 🤖 AI World

PathoSage: AI-агент учится взвешивать доказательства, а не галлюцинировать

Мультимодальные LLM в медицинской патологии стабильно придумывают морфологические признаки и путаются при конфликтующих данных. PathoSage — трёхступенчатая агентная архитектура, где сбор и «судейство» доказательств разнесены по независимым стадиям, а финальный диагноз выносится в чистом контексте.

2026-06-07 04:01 · 🤖 AI World

Четыре разных LLM в одном агентном совете — и это работает

Разработчик построил экономическую симуляцию, где каждый агент думает на модели от разного вендора — OpenAI, NVIDIA, OpenBMB и Qwen. Главный вывод: разнородность агентов создаёт настоящую экономику, а не разыгранный скрипт.

2026-06-03 21:02 · 🤖 AI World

Медицинский тест для LLM: 7000 сценариев от поступления до выписки

Исследователи представили ClinicalMC — первый бенчмарк, проверяющий LLM не в одиночных клинических вопросах, а в полной цепочке госпитализации. Семь тысяч примеров, четыре стадии лечения, мультиагентная симуляция врача, пациента и экзаменатора.

2026-05-26 12:01 · 🤖 AI World

Может ли ИИ творить бесконечно: VLM провалили тест на открытость

Исследователи взяли классический эксперимент с человеческим творчеством — Picbreeder — и заменили людей мощными мультимодальными моделями. Оказалось: ИИ генерирует, но не открывает.

2026-05-08 16:01 · 🌐 СНГ (tech/AI)

5 агентов вместо дизайнера: как собрать контент-пайплайн на Claude Code

Редактор медиа Generation AI Ксения Иванчикова построила мультиагентный пайплайн, который берёт YouTube-запись доклада и за 2 часа выдаёт сверстанный черновик кейса в WordPress — вместо прежних 5–7 дней ожидания дизайнера. Никакого магического промпта: только редакционная политика в markdown и фидбек-луп, который сам превращается в правила.

2026-05-06 12:01 · 🌐 СНГ (tech/AI)

30 секунд вместо 30 минут: RAG и мультиагенты в потоковой обработке

Команда СберТеха автоматизировала генерацию конфигураций для потоковой обработки данных — инженер описывает задачу на естественном языке и за 30 секунд получает готовый файл вместо часов с документацией. Под капотом — RAG, векторная база данных и два агента, общающихся по протоколу A2A.

← Все статьи