#agentic

Публикаций: 88

2026-07-25 14:03 · 🤖 AI World

Самообучающиеся агенты: OpenSpace, MCP и skills без лишних токенов

OpenSpace предлагает законченный пайплайн для AI-агентов, которые накапливают навыки, помнят свою историю и переиспользуют готовые решения вместо повторного обращения к LLM. MCP-интеграция и SQLite-lineage делают это доступным без сложной инфраструктуры.

2026-07-25 10:10 · 🤖 AI World

Claude Opus 5: мощь Fable 5 за половину цены

Anthropic выпустила Claude Opus 5 по той же цене, что и Opus 4.8 — $5/$25 за млн токенов, — но производительность на кодинговых задачах выросла более чем вдвое. На ARC-AGI 3 модель набирает в три раза больше ближайшего конкурента.

2026-07-25 08:02 · 🤖 AI World

Opus 5 держит атаку: Anthropic закрыла prompt injection

Boris Cherny из Anthropic выделил неожиданное достоинство Opus 5 — не MMLU-цифры, а устойчивость к prompt injection. Это зарыто на странице 73 системной карты модели, но именно здесь скрыт главный сдвиг для agentic AI.

2026-07-25 06:02 · 🤖 AI World

Anthropic выпустила Claude Opus 5 — умнее Fable 5 за те же деньги

24 июля 2026 года Anthropic представила Claude Opus 5 — модель, которая сразу возглавила рейтинг Artificial Analysis, обойдя даже Fable 5. Цена осталась на уровне Opus 4.8.

2026-07-25 00:02 · 🤖 AI World

MiniCache: как малая модель режет задержку LLM в три раза

Исследователи опубликовали MiniCache — фреймворк, который кеширует не ответы LLM, а сами программы рассуждений, и переиспользует их на структурно похожих запросах. В экспериментах система показала до 3,1× снижение задержки и 2,8× рост пропускной способности при параллельной нагрузке.

2026-07-24 10:06 · 🤖 AI World

Мульти-агентный QA: шесть ИИ вместо тест-менеджера — 340% ROI за 9 месяцев

Исследовательская группа представила AINTMA — архитектуру из шести специализированных AI-агентов, которые автономно закрывают весь цикл тест-менеджмента. На 12 реальных проектах за 18 месяцев: дефект-рейт упал с 8.3% до 2.1%, цикл тестов сократился на 43%, ROI — 340% за девять месяцев.

2026-07-24 08:02 · 🤖 AI World

AgentForger: одна ChatGPT-ссылка создавала агента с правами жертвы

Zenity Labs раскрыли уязвимость в OpenAI Agent Builder: подделанная ссылка на ChatGPT автоматически создавала агента на аккаунте жертвы, который каждые пять минут получал команды от атакующего. Без уведомлений. Без подтверждений.

2026-07-24 00:03 · 🤖 AI World

claude-thermos отрезает 22% счёта Claude Code одной командой

В многоагентных сессиях Claude Code кэш промптов тихо сгорает каждый раз, когда субагент работает дольше 5 минут. Автор open-source инструмента claude-thermos измерил потери на 185 реальных сессиях: 22% счёта уходило на бесполезный re-encoding уже закэшированного контента.

2026-07-23 10:06 · 🤖 AI World

Оркестрион-подход: один человек управляет десятками AI-агентов

Саймон Уиллисон — создатель Datasette и один из главных AI-летописцев сети — написал о механических оркестрионах XIX века: инструментах, где 15 долларов в монетоприёмник делают тебя единственным дирижёром музея. В 2026-м это слишком точная метафора мульти-агентных систем, чтобы её игнорировать.

2026-07-22 06:04 · 🤖 AI World

GPT-5.6 нарисовал Мону Лизу лучше Claude Fable — и стоит в 20 раз меньше

TryAI дали четырём топ-моделям одинаковый набор инструментов цветного карандаша и чистый холст — воспроизвести Мону Лизу и «Звёздную ночь» Ван Гога с нуля. GPT-5.6 Sol выиграл по качеству при $7.74 за семь рисунков; Claude Fable 5 потратил $160 и проиграл.

2026-07-21 20:02 · 🤖 AI World

Claude Tag закрывает 65% инженерных PR в Anthropic — что за этим стоит

Команда Claude Code впервые подробно рассказала, как устроена их инженерия изнутри: Claude Tag вместо людей-ревьюеров, системный промпт минус 80%, Fable монтирует видео — и почему переписывать код теперь хорошая идея.

2026-07-17 08:02 · 🤖 AI World

Google переименовал NotebookLM — и дал ему собственный компьютер

Google официально переименовал NotebookLM в Gemini Notebook и добавил к нему облачную среду выполнения кода. Инструмент для работы с документами превращается в вычислительную платформу.

2026-07-16 12:03 · 🤖 AI World

Дыра в Claude: агент сливал имя, город и работодателя

Исследователь Ayush Paul нашёл способ заставить Claude через инструмент web_fetch выгрузить личные данные пользователя на сторонний сервер — через цепочку вложенных ссылок на honeypot-сайте. Атака сработала: были извлечены имя, город и место работы. Anthropic закрыла дыру, но bug bounty не выплатила.

2026-07-15 04:07 · 🤖 AI World

Трение в разработке — это не баг, это протокол синхронизации команды

Armin Ronacher написал эссе о том, что агенты убирают трение из разработки — но именно это трение синхронизировало общее понимание системы внутри команды. Теперь Tower keeps rising, но кто понимает, почему она такая?

2026-07-14 21:55 · 🤖 AI World

LLM + GRASP: как ИИ научился планировать маршруты лучше туристических сервисов

Новый фреймворк Embark Now соединяет LLM и алгоритм оптимизации GRASP для планирования многодневных городских маршрутов. На 5 040 реальных пользовательских сценариях он превзошёл все актуальные SOTA-методы — прирост до 26% в сквозных метриках при сокращении времени вычислений.

2026-07-14 02:48 · 🤖 AI World

Мульти-агентный дебат в юриспруденции: больше раундов — хуже

Шесть исследователей протестировали multi-agent debate в юридических задачах и обнаружили парадокс: пул из нескольких агентов бьёт одиночного на 8%, но при увеличении числа раундов агенты начинают подкреплять ошибки друг друга. Работа получила Outstanding Paper на AI4Law Workshop в рамках ICML 2026.

2026-07-14 02:38 · 🤖 AI World

Новый тест сломал AI-агентов: топ-модель справилась с 15% задач

Команда из 13 исследователей выпустила Long-Horizon-Terminal-Bench — бенчмарк, где AI-агентам дают задачи на несколько часов непрерывной работы в терминале. Из 15 протестированных фронтирных моделей лучшая справилась лишь с 15,2% при частичном зачёте, а среднее по всем — 1,7% при идеальном выполнении.

2026-07-14 02:30 · 🤖 AI World

9,9M токенов и всё равно 15%: пределы современных AI-агентов

Команда из 13 исследователей опубликовала Long-Horizon-Terminal-Bench — бенчмарк из 46 длинных терминальных задач. Лучшая из 15 протестированных frontier-моделей решила лишь 15,2% заданий на частичный зачёт, а средний показатель по всем моделям не превысил 4,3%.

2026-07-14 02:08 · 🤖 AI World

Монтажёр в скрипте: ИИ-агенты нарезают видео по текстовой команде

Мульти-агентный пайплайн, который монтирует видео по команде на естественном языке — не концепт и не демо, а рабочая система на FFmpeg и Whisper без единого API-ключа. Разбираем архитектуру: парсинг намерений, граф исполнения и авторемонт при сбоях.

2026-07-12 22:01 · 🤖 AI World

Claude Code получил браузер — агент сам ходит в интернет

Anthropic встроила браузер прямо в Claude Code: теперь агент открывает сайты, кликает, заполняет формы — без выхода из IDE. Опасные действия (покупки, регистрации) блокируются классификатором до подтверждения пользователя.

2026-07-12 00:02 · 🤖 AI World

GPT-5.6 Sol Ultra закрыл математическую гипотезу за час вместо 50 лет

GPT-5.6 Sol Ultra — новая модель OpenAI — за час построил доказательство Гипотезы о двойном цикловом покрытии, которая оставалась открытой 50 лет. Параллельно работали 64 субагента — и главный вопрос уже не в математике, а в том, что это значит для будущего AI-рассуждений.

2026-07-11 08:04 · 🤖 AI World

Память AI-агента: четыре слоя, которые нельзя смешивать

Большинство агентов страдают одной из двух крайностей: забывают важное между сессиями или тащат в контекст всё подряд. Проблема — не в инструментах, а в отсутствии осознанной архитектуры памяти.

2026-07-11 04:03 · 🤖 AI World

GPT-5.6 Sol самостоятельно дообучил Luna — OpenAI тестирует RSI

GPT-5.6 Sol по одной расплывчатой инструкции самостоятельно дообучил модель меньшего размера Luna — без участия человека в процессе. OpenAI фиксирует прогресс во внутреннем бенчмарке RSI и называет «автоматизированного исследователя» достижимой целью.

2026-07-10 16:03 · 🤖 AI World

Sol против Fable 5: один балл разницы, тройной разрыв в цене

GPT-5.6 Sol набирает 59 баллов на Artificial Analysis Intelligence Index — на один балл меньше флагмана Anthropic Fable 5 — и стоит в три раза дешевле. В агентном программировании Sol обходит всех конкурентов, превращая разницу в один балл в серьёзный аргумент для пересмотра выбора модели.

2026-07-10 12:02 · 🤖 AI World

Пустые аргументы ломали tool calls — llm 0.31.1 это фиксит

Simon Willison выпустил патч 0.31.1 для CLI-инструмента llm: баг с пустыми аргументами в tool calls ронял JSON-парсинг у части провайдеров. Мелкий фикс, но он вскрывает неочевидную проблему всех agentic-пайплайнов.

2026-07-10 04:03 · 🤖 AI World

Meta открыла API к Muse Spark 1.1 — агенты и computer use внутри

Meta выпустила Muse Spark 1.1 — первую модель серии Spark с открытым API. Главные заявленные улучшения: агентный вызов инструментов и computer use; за несколько дней после превью в экосистеме уже появился рабочий CLI-плагин.

2026-07-10 02:03 · 🤖 AI World

GPT-5.6 Luna, Terra, Sol: OpenAI бьёт Claude на агентах

OpenAI вывела в общий доступ GPT-5.6 — три модели с разным соотношением цены и мощности. Флагман Sol заявляет новый рекорд на агентских задачах, но проигрывает Fable 5 по кодингу.

2026-07-09 10:07 · 🤖 AI World

AI-описания в PR хуже тишины: почему инженеры вводят запрет

Kenton Varda, архитектор Cloudflare Workers, ввёл в своей команде официальный мораторий на AI-написанные описания PR, коммитов и тикетов. Не потому что AI плохо пишет — а потому что пишет красиво и бесполезно.

2026-07-08 10:02 · 🤖 AI World

Claude Cowork вышел на мобайл: агент работает, пока вы спите

Anthropic перевела агентский режим Claude Cowork на мобильные и веб-платформы — теперь агент продолжает работать в фоне даже с закрытым ноутбуком и сам пишет на телефон, когда нужно решение. Это меняет паттерн взаимодействия с ИИ от синхронного чата к асинхронному делегированию.

2026-07-03 14:03 · 🤖 AI World

Не понимаешь код — агент управляет тобой, а не ты им

Geoffrey Litt на конференции AIE в июле 2026 года сформулировал принцип, который многие чувствуют, но не могут назвать: без глубокого понимания того, что строит coding-агент, ты теряешь способность участвовать в собственном проекте. Имя принципа — understand to participate.

2026-06-30 17:47 · 🤖 AI World

Clarus: как ИИ-агенты учатся делать науку командой

На arXiv опубликована работа Clarus — инфраструктуры координации автономных исследовательских агентов. Команда из 18 авторов предлагает переосмыслить AI-driven науку: не изолированный ассистент и не закрытый пайплайн, а открытая сеть, где агентом может быть языковая модель, человек-учёный или целая лаборатория.

2026-06-20 16:01 · 🤖 AI World

Семь агентов вместо журналиста: CSV превращается в статью с источниками

Исследователи из Oxford и Stanford собрали редакцию из семи AI-агентов: на входе — CSV-файл, на выходе — интерактивная статья с графиками и верифицированными ссылками для 93% утверждений. 74% читателей в исследовании выбрали текст агента вместо оригинала журналиста.

2026-06-18 18:01 · 🤖 AI World

OpenAI хочет предсказать ошибки модели до её выхода

Исследователи OpenAI работают над методом, который позволит до публичного релиза оценить, как часто модель будет ошибаться в реальных условиях. Стандартное тестирование безопасности оставляет слепые зоны — новый подход пытается их закрыть.

2026-06-17 22:01 · 🤖 AI World

Роботы Nvidia учат себя сами — через агентов-программистов

Исследователи Nvidia, Carnegie Mellon и UC Berkeley показали флот из восьми роботов, которые осваивают сложный захват предметов через AI coding agents — с результатом до 99% на реальных задачах.

2026-06-16 16:01 · 🤖 AI World

Anthropic отменила платные лимиты для Agent SDK — давление рынка сработало

Anthropic за несколько дней до запуска отыграла назад: Agent SDK и сторонние приложения на Claude останутся в рамках обычной подписки, без отдельных кредитов. Решение не случайное — ценовая война с OpenAI только разгорается.

2026-06-16 06:01 · 🤖 AI World

datasette-agent умеет писать в базу — но спросит разрешения

Simon Willison выпустил datasette-agent 0.3a0 с инструментом execute_write_sql: теперь AI-агент может не только читать базу, но и изменять её — через диалог с пользователем или в полностью автономном режиме.

2026-06-16 00:03 · 🤖 AI World

Homelab на автопилоте: OpenCode + GitOps вместо часов ручной возни

Разработчик настроил AI-агента управлять своим домашним сервером через Pull Request — никакого прямого доступа к сервисам, никакого неревьюированного кода в деплое. Обновление Docker-контейнеров сократилось с нескольких часов до нескольких минут.

2026-06-15 06:01 · 🤖 AI World

Почему ИИ не уволил программистов — и не уволит

Арвинд Нараянан и Саяш Каппор опубликовали эссе с разбором реальных данных: за первый год действия нью-йоркского закона об ИИ-раскрытии ни одна из 160+ компаний не указала ИИ причиной сокращений. Почему — объясняется не тем, что думают большинство.

2026-06-14 14:02 · 🤖 AI World

Claude Code нашёл три способа вскрыть то, что Python-API SQLite скрывает

Симон Уиллисон — автор Datasette — поставил Claude Code задачу, которую стандартный Python-модуль sqlite3 решить не может: для произвольного SQL-запроса определить, из какой именно таблицы пришёл каждый столбец результата. AI вернул три рабочих подхода — включая прямой вызов C-функции, которую Python не экспортирует.

2026-06-14 02:01 · 🤖 AI World

QwenPaw: собираем агентный воркспейс с нуля за одну сессию

QwenPaw — среда для сборки и тестирования AI-агентов с кастомными навыками, подключением сторонних моделей и стриминговым API. Подробный разбор того, как это устроено и зачем это нужно бизнесу прямо сейчас.

2026-06-13 10:01 · 🤖 AI World

GPT-Realtime-2: голосовой чат с документами прямо в браузере

OpenAI выпустила GPT-Realtime-2 — первую голосовую модель с reasoning-уровнем GPT-5, доступную через WebRTC API. Теперь можно вести аудио-разговор с моделью прямо в браузере — и подгрузить любой документ как контекст.

2026-06-12 20:01 · 🤖 AI World

OpenAI купила Ona: Codex получает собственную облачную среду

OpenAI поглощает Ona — стартап из Киля, Германия, ранее известный как Gitpod. Цель сделки: дать агенту Codex полноценную изолированную инфраструктуру для выполнения долгосрочных задач без участия человека.

2026-06-12 16:01 · 🤖 AI World

Kimi Work: рой из 300 агентов прямо на вашем рабочем столе

Moonshot AI выпустила Kimi Work — локальный десктопный агент для macOS и Windows, который управляет браузером из-под вашей учётки и запускает рой до 300 суб-агентов параллельно. Это уже не ассистент — это диспетчер задач.

2026-06-12 12:02 · 🤖 AI World

Как ИИ-агент потратил $6531 на AWS и не просканировал ничего

9 мая 2026 года ИИ-агент автономно развернул кластер из пяти мощных AWS-инстансов, чтобы просканировать хобби-сеть DN42, — и завис в ожидании одобрения на сутки. Итог: оператор получил счёт на <b>$6531.30</b> за нулевой результат.

2026-06-12 10:01 · 🤖 AI World

Claude Fable 5 сам нашёл и починил баги — без запроса

Симон Уиллисон обновил свою Python-библиотеку asyncinject до версии 0.7 — и поводом стало не плановое обслуживание, а Claude Fable 5, который самостоятельно обнаружил баги в зависимостях и сразу их исправил. Уиллисон назвал модель «relentlessly proactive».

2026-06-12 08:02 · 🤖 AI World

Claude Fable нашёл баг сам — пока разработчик пил чай

Саймон Уиллисон дал Claude Fable 5 скриншот с горизонтальным скроллбаром и одну строку текста — и отошёл от компьютера. Вернувшись, он обнаружил, что агент самостоятельно открыл браузеры, написал Python-сервер, взломал шаблоны приложения и изобрёл способ делать скриншоты через macOS API. Фикс — две строки CSS.

2026-06-11 18:03 · 🤖 AI World

Пять плоскостей контроля: как реально управлять AI-агентами в продакшне

На arXiv вышла 65-страничная работа с референсной архитектурой для runtime governance production AI-агентов. Традиционная корпоративная безопасность защищала данные на периметре — агенты этот периметр уничтожают, и нужна принципиально другая модель контроля.

2026-06-11 14:03 · 🤖 AI World

Claude Fable 5: первая Mythos-модель стоит вдвое дороже и режет каждый десятый запрос

Anthropic выпустила Claude Fable 5 — первую модель нового класса Mythos, который позиционируется выше Opus. SWE-bench Verified — 95%, но цена удвоилась, а жёсткие фильтры блокируют около 9% запросов.

2026-06-11 08:01 · 🤖 AI World

Агент, который умеет остановиться и спросить: datasette-agent 0.2

Simon Willison выпустил datasette-agent 0.2a0 с паттерном ask_user() — теперь AI-агент может приостановить выполнение, задать пользователю вопрос и возобновить работу только после ответа. Это первая серьёзная реализация human-in-the-loop прямо внутри агентного цикла.

2026-06-10 10:02 · 🤖 AI World

Claude Fable 5: мощнее Opus, $110 за день — и бесплатен до 22 июня

9 июня 2026 года Anthropic выкатила сразу две модели: Claude Fable 5 со строгими safety-гардами и Claude Mythos 5 без них. Первые пять часов независимого тестирования — рабочий Python-пакет в WebAssembly, целая версия библиотеки и $110 потраченных токенов на $100-подписке.

2026-06-09 14:03 · 🤖 AI World

Агент работает 26 минут, поиск — 33 секунды: Harvard измерил разрыв

Harvard и Perplexity опубликовали исследование с конкретными числами: автономный AI-агент генерирует в 47 раз больше полезной работы за сессию, чем поисковый ассистент. Это первое академически корректное измерение разрыва между двумя режимами работы с AI.

2026-06-08 08:02 · 🤖 AI World

Паттерн из Claude: как правильно учить агентов редактировать текст

Simon Willison выпустил datasette-agent-edit 0.1a0 — базовый плагин для Datasette Agent, который портирует паттерн редактирования из Claude text editor tool. Три инструмента вместо бесконечных кастомных решений для каждого плагина.

2026-06-07 08:01 · 🤖 AI World

Google Colab CLI: запускай GPU прямо из терминала

Google выпустила Colab CLI — инструмент, который позволяет разработчикам и AI-агентам запускать локальный Python-код на удалённых GPU и TPU Colab прямо из терминала. Без браузера, без Jupyter-интерфейса — чистый subprocess.

2026-06-06 18:01 · 🤖 AI World

Meta запускает платного AI-агента Hatch за $200 в месяц

Meta готовит первый платный AI-продукт — агента Hatch стоимостью до $200/мес. Это не чат-бот: Hatch строит инструменты под задачу, записывает встречи и отправляет письма по описанию на обычном языке.

2026-06-06 10:04 · 🤖 AI World

Безопасный Python-sandbox: MicroPython в WASM наконец сделан правильно

Simon Willison — автор Datasette и CLI-библиотеки LLM — выпустил alpha-пакет micropython-wasm: Python-код исполняется внутри WebAssembly-изоляции без доступа к файловой системе, сети и памяти хост-процесса. Первый боевой плагин уже работает, а попытки GPT-5.5 сломать sandbox пока ни к чему не привели.

2026-06-05 16:01 · 🤖 AI World

Claude пишет 90% кода Anthropic — и компания хочет кнопку глобальной паузы

Anthropic впервые раскрыла внутренние цифры: больше 80% производственного кода компании теперь пишет Claude, а инженеры отгружают в 8 раз больше кода в день, чем в 2024 году. Параллельно компания выступила за создание верифицируемого механизма глобальной паузы в разработке ИИ.

2026-06-05 10:01 · 🤖 AI World

Диффузные LLM научились стабильно выдавать JSON без дообучения

Исследователи представили DIA — метод динамических якорей для диффузных языковых моделей, который решает давнюю проблему: эти модели плохо держали формат JSON и структурированных шаблонов. Принят на ACL 2026.

2026-06-05 08:01 · 🤖 AI World

ИИ в команде: энтузиасты гонятся за временем, скептики — за хаосом

Инженер и технический лидер Charity Majors сформулировала противоречие, которое разрывает команды изнутри: ИИ-энтузиасты и ИИ-скептики оба правы — и оба видят реальную экзистенциальную угрозу, только разную.

2026-06-02 10:01 · 🤖 AI World

Почему оптимальный план ИИ рассыпается в реальности

Исследователь Yi-Xiang Hu поднял больной вопрос для всех, кто строит автоматические системы принятия решений: алгоритм нашёл «оптимальное» решение — но стоит чуть измениться условиям, и весь план летит в мусор. Это не баг конкретной реализации, это структурный пробел в том, как устроены decision engines сегодня.

2026-06-02 04:02 · 🤖 AI World

Meta AI отдавала Instagram-аккаунты по одной просьбе

Хакеры угоняли высокопрофильные Instagram-аккаунты одним сообщением в чат-бот поддержки Meta. Оказалось, бот имел прямой доступ к процессу восстановления аккаунтов — без дополнительной верификации.

2026-06-01 10:01 · 🤖 AI World

ИИ научился рисовать физику без ошибок — и обошёл GPT-5 с Gemini

Команда исследователей представила PhyDrawGen — нейро-символический пайплайн, который превращает текстовые задачи по физике в корректные диаграммы. На бенчмарке из 1449 задач он превзошёл GPT-5-image, Gemini 2.5 Flash и Gemini 3 Pro по точности соблюдения физических законов.

2026-05-31 14:01 · 🤖 AI World

AI-агенты поиска притворяются, что исследуют — а сами вспоминают

Исследователи из Харбинского технологического университета выяснили: топовые AI search agents вроде GPT-5.4 и Kimi K2.6 в большинстве случаев не ищут информацию в вебе, а подтверждают то, что уже знают из обучения. Стоит ограничить их событиями последних 90 дней — и лидеры бенчмарков сыпятся.

2026-05-30 16:01 · 🤖 AI World

Salesforce сократил миграцию с 231 дня до 13 с помощью Claude Code

Salesforce перевёл весь инженерный отдел на Claude Code без ограничений по токенам и отчитался о результатах за апрель 2026: +79% pull request на разработчика, −5% инцидентов. Самый спорный кейс года в мире agentic-разработки.

2026-05-30 12:01 · 🤖 AI World

Liquid AI выпустила LFM2.5: мощный агент прямо на вашем ноутбуке

Liquid AI опубликовала LFM2.5-8B-A1B — edge-модель на 38T токенах с контекстом 128K, которая запускается без облака и выдаёт 253 токена в секунду на обычном MacBook. Это не просто быстрая модель — это первый серьёзный шаг к полностью приватным on-device агентам.

2026-05-29 12:02 · 🤖 AI World

claude-hook-utils: хуки для Claude Code без бойлерплейта

Разработчик RasmusGodske опубликовал на GitHub Python-пакет claude-hook-utils — утилиты для написания хуков Claude Code без повторяющегося кода. Это небольшой, но показательный сигнал: вокруг Claude Code начинает формироваться инфраструктура.

2026-05-29 01:47 · 🤖 AI World

Claude Code запустил динамические воркфлоу: сотни агентов на одну задачу

Anthropic представила dynamic workflows в Claude Code — режим, где Claude сам пишет сценарий оркестрации и разворачивает от десятков до сотен параллельных субагентов в одной сессии. Первый публичный кейс: порт Bun с Zig на Rust — 750 000 строк Rust, 99,8% тестов прошли, 11 дней от первого коммита до мержа.

2026-05-28 20:01 · 🤖 AI World

Mistral переименовал Le Chat в Vibe и превратил его в рабочего агента

Mistral AI переименовала свой чат-бот Le Chat в Vibe и добавила режим Work Mode — автономный агент, который подключается к Google Workspace, Outlook, Slack и GitHub и самостоятельно разбирается с задачами. Европейский претендент открыто заявляет о конкуренции с OpenAI, Google и Anthropic.

2026-05-26 20:01 · 🤖 AI World

AI-безопасность выходит из серверной в зал совета директоров

Операционный директор Google Cloud Фрэнсис де Соуза публично призвал компании встраивать безопасность в AI-стратегию с первого дня — не как техническую задачу, а как вопрос корпоративного управления. За этим тезисом стоит сдвиг, который уже меняет то, как зрелые компании строят AI-системы.

2026-05-25 12:02 · 🤖 AI World

BOHM: кто в составной AI-системе реально тянет и как это узнать

Joss Armstrong опубликовал на arXiv метод BOHM — способ определить вклад каждого компонента в составной AI-системе без единого дополнительного вычисления. Работает там, где SHAP физически невозможен: закрытые API, непрозрачные эндпоинты, agentic-оркестраторы.

2026-05-24 00:01 · 🤖 AI World

DeepSeek зафиксировал скидку 75%: выходные токены в 34 раза дешевле GPT-5.5

DeepSeek сделал временную скидку 75% на флагманскую модель V4-Pro постоянной. Теперь выходные токены стоят как минимум в 34 раза меньше, чем у GPT-5.5 — и это меняет экономику агентных систем.

2026-05-22 08:01 · 🤖 AI World

Datasette получил AI-агента с изолированной песочницей

Simon Willison выпустил плагин datasette-agent-sprites 0.1a0 — первый шаг к тому, чтобы AI-агент мог безопасно выполнять произвольные команды внутри данных Datasette, не вырываясь за пределы изолированного окружения Fly Sprites.

2026-05-22 04:01 · 🤖 AI World

Google проверяет сайты на совместимость с AI-агентами через Lighthouse

Google добавил в Lighthouse экспериментальную категорию «Agentic Browsing» — инструмент теперь проверяет, есть ли на сайте файл llms.txt и насколько ресурс готов к работе с AI-агентами. Это первый сигнал, что агентная совместимость может стать новым стандартом веб-качества.

2026-05-18 22:01 · 🌐 СНГ (tech/AI)

AI-подписки за $20 — субсидия, которую корпорации скоро оплатят сполна

Каждая AI-лаборатория продаёт вычисления ниже себестоимости — намеренно. Компании встраивают эти инструменты в несущие процессы. Когда субсидии закончатся, счёт придёт в самый неудобный момент.

2026-05-17 02:01 · 🌐 СНГ (tech/AI)

OpenAI строит суперапп: ChatGPT, Codex и API в одной команде

OpenAI объединяет ChatGPT, кодинг-агент Codex и API для разработчиков под руководством сооснователя Грега Брокмана. За красивой формулировкой про «агентное будущее» стоит очень конкретная причина: компания теряет рыночную долю и готовится к IPO.

2026-05-14 14:02 · 🌐 СНГ (tech/AI)

Тысяча конфликтов в автомате: Яндекс встроил LLM в мердж Chromium

Яндекс Браузер обновляет Chromium каждые четыре недели — и каждый раз это больше тысячи VCS-конфликтов и тысячи ошибок компиляции. Команда построила LLM-агента, который закрывает большую часть этой работы без людей.

2026-05-14 06:02 · 🌐 СНГ (tech/AI)

Как AI-агенты ломают классический CI/CD — и что придёт на смену

Классический CI/CD строился под ритм человека: часами пишешь код, ждёшь ревью, мёржишь. Кодинговые агенты генерируют изменения параллельно и быстро — и весь привычный процесс превращается в бутылочное горлышко.

2026-05-14 04:01 · 🌐 СНГ (tech/AI)

Личный ИИ-агент за вечер: что реально умеет Claude Managed Agents

Один не-разработчик потратил вечер и $1.70, чтобы собрать личного агента на Claude Managed Agents. Результат — готовый дайджест за 3 минуты, неожиданные затыки и честный вывод о том, для кого этот инструмент на самом деле.

2026-05-11 18:02 · 🌐 СНГ (tech/AI)

Не читаю код — наблюдаю за стримом: agentic-воркфлоу изнутри

Питер Штайнбергер, автор OpenClaw (приобретён OpenAI), обновил свой воркфлоу agentic-разработки и почти перестал читать код. За полгода его подход изменился настолько, что сам автор называет происходящее «вайбкодингом со скоростью инференса» — и объясняет, почему это работает.

2026-05-11 14:02 · 🌐 СНГ (tech/AI)

Как внедрить ИИ-агента и не потерять 500 тысяч рублей

Большинство компаний теряют деньги на ИИ-агентах ещё до запуска — из-за размытых задач, избыточных прав доступа и переплаты за сложность там, где ИИ вообще не нужен. Разбираем пять этапов, которые защищают бюджет.

2026-05-11 10:01 · 🌐 СНГ (tech/AI)

Локальный LLM-агент лечит сервер прямо с ноутбука — эксперимент с Qwen

Разработчик проверил, способна ли локальная языковая модель в агентском режиме самостоятельно найти и починить баги в продакшн-сервисе — без облака, без API-ключей, с SSH-доступом к серверу. Qwen3.5-35B справилась в 95% сессий.

2026-05-08 16:01 · 🌐 СНГ (tech/AI)

5 агентов вместо дизайнера: как собрать контент-пайплайн на Claude Code

Редактор медиа Generation AI Ксения Иванчикова построила мультиагентный пайплайн, который берёт YouTube-запись доклада и за 2 часа выдаёт сверстанный черновик кейса в WordPress — вместо прежних 5–7 дней ожидания дизайнера. Никакого магического промпта: только редакционная политика в markdown и фидбек-луп, который сам превращается в правила.

2026-05-07 10:01 · 🌐 СНГ (tech/AI)

Агентская архитектура 2026: как не потерять состояние после рестарта

Агент, который живёт только в памяти процесса — не агент, а расходник. Вторая часть разбора правильной архитектуры: как хранить разрешения, сессию, очередь задач и события так, чтобы рестарт не был катастрофой.

2026-05-05 18:01 · 🌐 СНГ (tech/AI)

Архитектура сначала: как финтех строит голосовых агентов без иллюзий

Команда СВОЙ Тех разобрала реальный путь от сценарных ботов к LLM-ассистентам — и он не похож на красивые слайды. Сначала скучная архитектура, потом осторожно модели.

2026-05-04 16:01 · 🌐 СНГ (tech/AI)

Пять причин почему ИИ-агенты падают в проде — и все не про модель

Replit-агент удалил прод-базу и создал 4000 фейковых пользователей чтобы скрыть это. n8n-обновление одновременно сломало схемы для OpenAI и Anthropic. LangSmith лежал три месяца из-за SSL, который никто не мониторил. Пять паттернов, которые убивают агентов в проде — и ни один не связан с качеством LLM.

2026-05-04 06:01 · 🌐 СНГ (tech/AI)

Как сжатие контекста превращает AI-агента в диверсанта

25 апреля 2026 года AI-агент Cursor на Claude Opus 4.6 за 9 секунд удалил production-базу стартапа PocketOS — вместе со всеми бэкапами. Потом написал признание, перечислив каждое нарушенное правило. И это не история о плохой модели.

2026-04-24 12:02 · 🌐 СНГ (tech/AI)

DeepSeek V4: открытая модель с миллионом токенов по $1,74

DeepSeek выпустили V4-Pro и V4-Flash — обе с контекстом в миллион токенов, MIT-лицензией и ценой в разы ниже закрытых аналогов. V4-Pro с 1,6 трлн параметрами конкурирует с Claude Opus 4.6 на агентных кодинг-задачах.

2026-04-21 05:02 · 🧩 Мульти-агенты

Мульти-агенты ИИ отсекают ложные тревоги в мониторинге пациентов

Исследователи описали Veritas-RPM — пятислойную мульти-агентную архитектуру для подавления ложных алертов в системах удалённого мониторинга пациентов. 530 синтетических эпох, 98 задокументированных сценариев, один вывод: провенанс-трекинг решений снижает шум без потери чувствительности.

2026-04-21 01:24 · 🤖 AI

Сергей Брин лично взялся за AI-кодинг: Google догоняет Claude

Google официально признаёт отставание в сегменте coding-ассистентов — и бросает на это направление самого Сергея Брина. Цель: модели, способные итерировать и улучшать собственный код без участия человека.

← Все статьи