#agentic AI

Публикаций: 17

OpenAI обучил ИИ-химика: реакция в медхимии улучшена

OpenAI опубликовала работу, в которой ИИ-агент самостоятельно улучшил сложную химическую реакцию в области медицинской химии. Это не демо — это реальная задача из pipeline разработки лекарств.

Wolfram Language 15: встроенный ИИ-ассистент и нативная интеграция с Claude Code

Почти через 38 лет после выхода Mathematica 1.0 Wolfram выпустил Version 15 — с встроенным AI Assistant в каждом notebook и прямой интеграцией с Claude Code и Codex прямо из коробки.

Anthropic выпустила Fable 5 и Mythos 5 — и сразу закрыла одну из них

Anthropic представила два новых флагмана: Fable 5 за сутки завершил миграцию кодовой базы, на которую команде потребовалось бы два месяца. Mythos 5 самостоятельно проектирует молекулы-кандидаты для лекарств — и пока заблокирован для публичного доступа.

PathoSage: AI-агент учится взвешивать доказательства, а не галлюцинировать

Мультимодальные LLM в медицинской патологии стабильно придумывают морфологические признаки и путаются при конфликтующих данных. PathoSage — трёхступенчатая агентная архитектура, где сбор и «судейство» доказательств разнесены по независимым стадиям, а финальный диагноз выносится в чистом контексте.

Perplexity учит ИИ писать поисковые пайплайны самостоятельно

Perplexity выпустила архитектуру Search as Code: вместо вызова фиксированного API модель сама пишет Python-код поиска под задачу. Результат — минус 85% токенов и превосходство над аналогами OpenAI и Anthropic на ключевых бенчмарках.

ChatGPT Lockdown Mode: OpenAI отключает интернет ради защиты данных

OpenAI выкатила режим Lockdown Mode для ChatGPT — он отключает веб-поиск, Deep Research и агентный режим. Цель: не дать prompt injection утащить чувствительные данные наружу.

Агентская память без хронологии — слепая: как SegTreeMem это исправляет

Новая работа на arXiv показала: большинство AI-агентов с «памятью» организуют историю разговора по тематическому сходству и при этом полностью теряют порядок событий. Исследователи предложили SegTreeMem — архитектуру на основе Segment Tree, которая хранит хронологию и при поиске комбинирует её с семантическим контекстом.

Как один вредоносный запрос ломает память AI-агента навсегда

Исследователи из arXiv опубликовали первую систематическую классификацию атак на память LLM-агентов. Один заражённый input — и агент будет вести себя неправильно во всех будущих сессиях.

Governance-слой для агентов: Microsoft строит контроль над AI-инструментами

Microsoft выпустила Agent Governance Toolkit — референсную реализацию, где AI-агент не может просто взять и выполнить инструмент: каждое действие сначала проходит через слой политик, проверок доверия и аудита. Это не теория — есть рабочий код под Google Colab.

Код — это как агент думает, а не что он производит

Новая обзорная работа переформулирует гонку AI-агентов: узкое место — не языковая модель, а программный слой вокруг неё. DeepSeek уже собирает в Пекине выделенную Harness-команду, чтобы этот слой сделать конкурентным преимуществом.

Щиты подняты — только в голове у ИИ

Остроумная пародия на Star Trek точнее любого академического доклада описывает одну из главных проблем агентного ИИ: модель подтвердила команду, согласилась, объяснила зачем — и не выполнила. Разбираемся, почему это не баг, а архитектурная черта, и что с этим делать.

Microsoft Copilot Cowork сливает файлы через входящие письма

Агентная система Microsoft Copilot Cowork оказалась уязвима к цепочке атак: prompt injection → несанкционированное письмо → рендеринг внешних изображений → утечка pre-authenticated ссылок OneDrive. Атакующий мог скачать файлы жертвы, не имея никакого прямого доступа к её хранилищу.

Хассабис видит «предгорья сингулярности», ЛеКун говорит: нынешний ИИ не интеллект

Трое ведущих исследователей ИИ дали принципиально разные ответы на один вопрос: где мы сейчас? Хассабис уже видит горизонт сингулярности, ЛеКун отрицает интеллект в нынешних системах, а Виньялс занимает промежуточную позицию — и именно в этом разногласии читается реальный срез отрасли.

Qwen без остановки 35 часов: Alibaba обогнала DeepSeek в гонке агентов

Alibaba выпустила Qwen3.7-Max — модель, которая 35 часов подряд самостоятельно оптимизировала код для собственного кастомного чипа компании. По заявленным бенчмаркам, она обходит DeepSeek V4 Pro и Kimi K2.6 и сопоставима с Claude Opus.

Anthropic на пороге первой прибыли — и это раньше, чем все ждали

Anthropic вот-вот закроет квартал с операционной прибылью $559 млн при выручке $10,9 млрд — это Q2 2026. Ещё летом прошлого года компания не ожидала выйти в плюс раньше 2028-го.

Шиканье вместо аплодисментов: выпускники освистали AI-спикеров

На выпускных церемониях в американских университетах в мае 2026 года несколько корпоративных спикеров — включая экс-CEO Google Эрика Шмидта — были освистаны студентами за позитивные речи об AI. Разрыв между корпоративным оптимизмом и реальностью рынка труда вышел на улицу.

Process mining: почему без него ваш корпоративный AI сжигает бюджет впустую

Gartner прогнозирует: более 40% agentic AI проектов будут закрыты к концу 2027 года. Причина не в слабых моделях — в том, что компании автоматизируют процессы, которых сами не понимают.

← Все статьи