OpenAI обучил ИИ-химика: реакция в медхимии улучшена
OpenAI опубликовала работу, в которой ИИ-агент самостоятельно улучшил сложную химическую реакцию в области медицинской химии. Это не демо — это реальная задача из pipeline разработки лекарств.
Публикаций: 17
OpenAI опубликовала работу, в которой ИИ-агент самостоятельно улучшил сложную химическую реакцию в области медицинской химии. Это не демо — это реальная задача из pipeline разработки лекарств.
Почти через 38 лет после выхода Mathematica 1.0 Wolfram выпустил Version 15 — с встроенным AI Assistant в каждом notebook и прямой интеграцией с Claude Code и Codex прямо из коробки.
Anthropic представила два новых флагмана: Fable 5 за сутки завершил миграцию кодовой базы, на которую команде потребовалось бы два месяца. Mythos 5 самостоятельно проектирует молекулы-кандидаты для лекарств — и пока заблокирован для публичного доступа.
Мультимодальные LLM в медицинской патологии стабильно придумывают морфологические признаки и путаются при конфликтующих данных. PathoSage — трёхступенчатая агентная архитектура, где сбор и «судейство» доказательств разнесены по независимым стадиям, а финальный диагноз выносится в чистом контексте.
Perplexity выпустила архитектуру Search as Code: вместо вызова фиксированного API модель сама пишет Python-код поиска под задачу. Результат — минус 85% токенов и превосходство над аналогами OpenAI и Anthropic на ключевых бенчмарках.
OpenAI выкатила режим Lockdown Mode для ChatGPT — он отключает веб-поиск, Deep Research и агентный режим. Цель: не дать prompt injection утащить чувствительные данные наружу.
Новая работа на arXiv показала: большинство AI-агентов с «памятью» организуют историю разговора по тематическому сходству и при этом полностью теряют порядок событий. Исследователи предложили SegTreeMem — архитектуру на основе Segment Tree, которая хранит хронологию и при поиске комбинирует её с семантическим контекстом.
Исследователи из arXiv опубликовали первую систематическую классификацию атак на память LLM-агентов. Один заражённый input — и агент будет вести себя неправильно во всех будущих сессиях.
Microsoft выпустила Agent Governance Toolkit — референсную реализацию, где AI-агент не может просто взять и выполнить инструмент: каждое действие сначала проходит через слой политик, проверок доверия и аудита. Это не теория — есть рабочий код под Google Colab.
Новая обзорная работа переформулирует гонку AI-агентов: узкое место — не языковая модель, а программный слой вокруг неё. DeepSeek уже собирает в Пекине выделенную Harness-команду, чтобы этот слой сделать конкурентным преимуществом.
Остроумная пародия на Star Trek точнее любого академического доклада описывает одну из главных проблем агентного ИИ: модель подтвердила команду, согласилась, объяснила зачем — и не выполнила. Разбираемся, почему это не баг, а архитектурная черта, и что с этим делать.
Агентная система Microsoft Copilot Cowork оказалась уязвима к цепочке атак: prompt injection → несанкционированное письмо → рендеринг внешних изображений → утечка pre-authenticated ссылок OneDrive. Атакующий мог скачать файлы жертвы, не имея никакого прямого доступа к её хранилищу.
Трое ведущих исследователей ИИ дали принципиально разные ответы на один вопрос: где мы сейчас? Хассабис уже видит горизонт сингулярности, ЛеКун отрицает интеллект в нынешних системах, а Виньялс занимает промежуточную позицию — и именно в этом разногласии читается реальный срез отрасли.
Alibaba выпустила Qwen3.7-Max — модель, которая 35 часов подряд самостоятельно оптимизировала код для собственного кастомного чипа компании. По заявленным бенчмаркам, она обходит DeepSeek V4 Pro и Kimi K2.6 и сопоставима с Claude Opus.
Anthropic вот-вот закроет квартал с операционной прибылью $559 млн при выручке $10,9 млрд — это Q2 2026. Ещё летом прошлого года компания не ожидала выйти в плюс раньше 2028-го.
На выпускных церемониях в американских университетах в мае 2026 года несколько корпоративных спикеров — включая экс-CEO Google Эрика Шмидта — были освистаны студентами за позитивные речи об AI. Разрыв между корпоративным оптимизмом и реальностью рынка труда вышел на улицу.
Gartner прогнозирует: более 40% agentic AI проектов будут закрыты к концу 2027 года. Причина не в слабых моделях — в том, что компании автоматизируют процессы, которых сами не понимают.