2026-05-15 06:03 · 🌐 СНГ (tech/AI)

Claude закрыл задачу Кнута за час — и это меняет всю научную инфру

В феврале 2026 года Дональд Кнут сообщил, что Claude Opus 4.6 за 31 итерацию решил открытую математическую задачу, над которой сам Кнут работал несколько недель. Это не демо — это сигнал о том, что научная инфраструктура построена под режим, который перестаёт быть основным.

Дональд Кнут — человек, чьё имя в computer science буквально означает «строгость» — в феврале 2026 года опубликовал у себя на странице в Стэнфорде кое-что неожиданное.

«Я с удивлением узнал, что открытая задача, над которой я работал несколько недель, только что была решена Claude Opus 4.6… Похоже, мне придётся пересмотреть своё мнение о генеративном AI» — Дональд Кнут, февраль 2026

31 итерация, около часа. Не демо, не маркетинговый кейс — верифицированный факт от человека, чья репутация и есть стандарт качества. И он ставит вопрос: под какой режим работы вообще построена вся научная инфраструктура сегодня?

Контекст

Наука в 2026 году выглядит по-разному в зависимости от точки наблюдения. Снаружи — привычный фасад: институты, рецензии, Nature и Science. Изнутри — перегруженная, наполовину случайная система. Эксперимент NeurIPS 2021 показал: 50,6% работ, принятых одним комитетом, отклоняются другим. Медианное время от подачи до финального решения — 198 дней. APC в Nature — $12 690. Глобальные выплаты шести крупнейшим open-access издателям выросли с $910 миллионов в 2019 году до $2,54 миллиарда в 2023-м. Рост не ускоряет циклы и не улучшает рецензии — он покупает доступ к узкому горлышку.

Производство при этом взрывается. Месячные подачи на arXiv в 2025 году: от 18 000 до 25 900. Подачи в NeurIPS: с 9 467 в 2020-м до 21 575 в 2025-м. Объём, который человеческие рецензенты вытянуть не могут. И LLM уже внутри с обеих сторон: по данным анализа Pangram Labs, около 21% рецензий на ICLR 2026 полностью сгенерированы AI. Из 19 490 поданных статей 199 — написаны машиной. Некоторые авторы встраивают prompt injection в PDF белым по белому — в расчёте на рецензента, который скармливает документ модели. Nature классифицирует это как научное мошенничество. Уже сейчас, уже измеримо.

И параллельно — AlphaEvolve от DeepMind в мае 2025 года нашёл алгоритм умножения матриц 4×4 за 48 скалярных умножений вместо 49. Первое улучшение алгоритма Штрассена за 56 лет. Та же система сейчас в продакшене, ускоряя matmul-ядро обучения Gemini на 23%. Это уже не «AI помогает учёным» — это AI производит оригинальные научные результаты.

Аналитика

Главная проблема не в том, что AI становится умнее. Проблема в структурной асимметрии. Инфраструктура потребления постепенно открывается агентам — arXiv строит MCP-сервер, появляются публичные API. Инфраструктура производства — закрывается. Nature, Science, IEEE запретили AI как автора. ICLR 2026 ввёл desk-rejection за нераскрытое использование LLM. Агентам дают читать — и отказывают в любом вкладе обратно. Цикл «производство → потребление → производство», на котором стоит вся наука, разорван именно там, где появился новый тип участника. Этот разрыв не стабилен.

Autoresearch Карпатого, запущенный в марте 2026 года, подтвердил ту же траекторию с другой стороны: агент автономно крутит ML-эксперименты всю ночь, коммитя только изменения, которые улучшают метрику. К маю 2026-го — 78 900 звёзд, 11 500 форков. Паттерн «агент крутит исследовательский цикл, человек задаёт правила» вошёл в мейнстрим. Есть конкретный артефакт, который тысячи людей копируют прямо сейчас.

Инфраструктура при этом осталась под режим «один человек читает один PDF». API Semantic Scholar — 1 запрос в секунду. API arXiv — 0,33. Шестимесячный цикл peer review теряет смысл, когда поле движется за недели. APC в $12 690 теряет смысл, когда модель человеческого труда, которую он оплачивает, и есть то, что ломается под нагрузкой. Все артефакты текущей системы нарушают своё базовое допущение одновременно, а не в одной точке — вот что делает момент нестандартным.

Ответом на этот разрыв пытается стать OpenArx — открытая MCP-инфраструктура (Apache 2.0, один разработчик + команда агентов). Ключевое архитектурное решение: при загрузке статьи capable LLM разбивает текст на смысловые единицы уровня идеи, классифицирует каждую (методология / результат / теоретическое / контекст), извлекает сущности и ключевую концепцию. Примитив — не «статья как документ», а «идея как структурная единица». Поверх — три MCP-профиля: потребление (15 инструментов, включая find_evidence и find_methodology), публикация без APC и endorsement, governance для выработки норм AI-native науки.

Кейсы применения в бизнесе

B2B-SaaS стартап в регулируемой отрасли (медтех, legaltech, финтех): команда тратит недели на литературный обзор перед каждой новой фичей. Агент с MCP-доступом к индексированному корпусу за час синтезирует state-of-the-art по конкретному методу, возвращает supporting и contradicting фрагменты с цитатами. Решение о методологии принимается за день, не за месяц. Прямой эффект — ускорение R&D-цикла и более сильная позиция на due diligence.

Корпорация с большим массивом внутренних документов (фарма, консалтинг, инжиниринг): ручной grep по 300 внутренних PDF заменяется структурированным запросом «найди методологии для задачи X» с фильтрацией по типу содержания до semantic search. Это другая категория результата — не список документов, а карта подходов с конкретными фрагментами и контекстом использования.

SMB или независимый исследователь в КР/СНГ: доступ к дорогостоящим журналам закрыт, APC заоблачные. Open-source инфраструктура без APC и endorsement-механики — это вход в научный дискурс без западного издательского шлюза. Для стартапа, который хочет обосновать свою технологию академически, это реальная альтернатива, а не теоретическая.

Кейсы в личной жизни

Разработчик или ML-инженер: перед выбором архитектуры запрашиваешь find_methodology с описанием задачи. Получаешь структурированный список: метод, ключевая идея, датасет, метрика. Час работы вместо недели чтения статей.

Контент-мейкер или научный журналист: нужно проверить утверждение или найти противоречия в публичном дискурсе. find_evidence по тезису возвращает supporting, contradicting и neutral фрагменты с цитатами. Фактчекинг становится структурированным, а не интуитивным — и защищает от ненамеренной дезинформации.

Аспирант или студент: explore_topic возвращает кластеры по ключевой концепции вместо ranked list статей. Это карта незнакомой области, а не лидерборд. Правильная форма для онбординга в новую тему — особенно если она быстро растёт.

Как применить сегодня

Проверить, доступен ли MCP-сервер arXiv в вашем клиенте (Claude Desktop, Cursor, Claude Code) — подключить и сформулировать запрос не по ключевым словам, а по типу содержания: «методологии для задачи X».
Запустить autoresearch-паттерн Карпатого на своей задаче: агент крутит цикл, вы задаёте метрику и правило коммита. Репозиторий открытый, шаблон адаптируется под большинство ML-задач.
Для любого литобзора менять форму запроса: не «суммируй эти статьи», а «сравни подходы к задаче X, выдели противоречия». Это меняет форму ответа с пересказа на структурированный анализ.
Если строите RAG-систему: рассмотреть подход «одна идея = одна структурная единица» с типом содержания и ключевой концепцией как альтернативу chunking фиксированного размера — архитектурное решение применимо к любому корпусу документов, не только научных.
Следить за OpenArx (Apache 2.0) как за живым примером MCP-инфраструктуры под агентные воркфлоу — даже если наука не ваш домен.

#Claude #LLM #научная инфраструктура #MCP #агенты

← Все статьи