← Все статьи
2026-06-14 12:02 · 🤖 AI World

Claude обогнал ChemDraw в предсказании ЯМР-спектров

Anthropic опубликовала первый white paper из серии «Claude как химик»: модель без химической дообучки сравнялась с профессиональным ПО ChemDraw и MestReNova на задаче ЯМР-предсказания — и единственная смогла работать в обратную сторону, восстанавливая структуру молекулы из спектра.

Claude обогнал ChemDraw в предсказании ЯМР-спектров

Anthropic впервые показала конкретные числа: Opus 4.7 тестировали против двух стандартных инструментов химиков — ChemDraw и MestReNova — на задаче предсказания ЯМР-спектров. Набор: 20 соединений из свежих ChemRxiv-препринтов, опубликованных уже после даты отсечки обучения моделей. Результат неожиданный даже для самой Anthropic.

Контекст

Ядерный магнитный резонанс (ЯМР) — базовый инструмент аналитической химии. Каждый раз, когда синтетик получает новое соединение, он снимает спектр и вручную сопоставляет каждый пик с атомом в структуре. Это медленно, требует экспертизы и плохо масштабируется: крупнейший химический реестр CAS содержит свыше 290 миллионов задокументированных веществ и прирастает примерно на 15 000 новых в сутки.

ML-инструменты для химии существуют давно — ретросинтез, предсказание реакций, оценка свойств. Но реальный уровень их проникновения в лаборатории низкий: данные разрознены, много нулевых результатов никто не публикует, форматы не совпадают, лучшие датасеты закрыты. ChemDraw и MestReNova решают одну конкретную задачу — прямое предсказание спектра по нарисованной структуре — и делают это хорошо уже много лет.

Принципиальное отличие современных LLM: они мультимодальны и умеют явно рассуждать. Claude может читать структуру прямо из рисунка в статье или от руки, разбирать методические разделы так, как они реально опубликованы, и показывать пошаговый ход рассуждений — то есть химик может аудировать вывод. Это меняет, какие задачи вообще становятся решаемыми.

Аналитика

На предсказании пиков водорода Opus 4.7 показал среднюю ошибку ±0.079 ppm — это меньше половины допуска ±0.20 ppm, который считается «правильным ответом» у химиков. По углероду Opus 4.7 и MestReNova фактически сыграли вничью: ±1.37 против ±1.48 ppm. По предсказанию тонкой структуры пика (мультиплетность и расстояние между подпиками) все три модели Claude попали в допуск порядка половины герца примерно в 80% случаев, тогда как ChemDraw и MestReNova — лишь в 26–35%.

Самое важное — обратная задача: дать модели спектр и формулу, получить структуру. Это то, что существующий софт делать не умеет (или требует 2D-ЯМР, специализированного обучения и платных лицензий). Opus 4.7 восстановил все 8 простых структур с первой попытки; из 7 сложных (спироциклы, конденсированные кольца) — четыре решил идеально во всех трёх запусках. Без химической дообучки. Это функциональная демонстрация, а не лабораторный курьёз.

Оговорки честные: выборка мала — 20 соединений для прямой задачи, 15 для обратной. Нет оценки на 2D-ЯМР, ряд растворителей и классов соединений не тестировался. Сами авторы пишут, что хотели бы проверить на нескольких сотнях молекул из 20–30 классов. То есть это не финальный бенчмарк, а первая публичная точка отсчёта.

Кейсы применения в бизнесе

Фармацевтический или химический стартап: исследовательский ассистент на базе Claude может автоматически сопоставлять ЯМР-данные с предложенными структурами, сокращая время на рутинную верификацию каждого нового соединения. Не заменяет аналитика-химика, но убирает механическую работу по «сверке пика с атомом».

Корпорация с большим портфелем патентов: перевод между структурными представлениями (SMILES, систематические названия, рисунки из патентов) — сквозная боль при поиске и мониторинге IP. Claude читает химические структуры прямо из PDF патентов без предварительной курации базы данных.

Небольшая аналитическая лаборатория в КР или Центральной Азии: доступ к ChemDraw и MestReNova — это лицензионные расходы. Claude работает через API и не требует специализированного ПО. Для задач базовой идентификации соединений это реальная экономия при сопоставимом или лучшем результате по ряду метрик.

Кейсы в личной жизни

Аспирант или молодой исследователь: вместо часов ручного сопоставления пиков — загрузить спектр и структуру в Claude, получить разбор с указанием проблемных пиков и объяснением расхождений. Хорошая точка для обучения: модель показывает ход рассуждений, и его можно разобрать.

Контент-мейкер или научный журналист: Claude уже умеет объяснять химические структуры через мультимодальный ввод — рисунок из статьи можно подать напрямую. Это упрощает подготовку материалов о новых молекулах, препаратах, материалах без необходимости самостоятельно разбираться в SMILES-нотации.

Фрилансер в области биоинформатики или хемоинформатики: возможность предложить клиентам пайплайн на базе Claude для скрининга и первичной аннотации химических данных — без дорогого специализированного ПО. Модель умеет читать методические секции статей и структурировать данные из неструктурированных источников.

Как применить сегодня

  • Загрузить структуру молекулы как SMILES-строку и попросить Opus 4.7 предсказать ¹H и ¹³C ЯМР-спектр с указанием растворителя — сравнить с экспериментальными данными.
  • Для задачи обратного восстановления структуры: передать молекулярную формулу (из масс-спектрометрии) + список пиков ¹H и ¹³C ЯМР — попросить предложить до трёх кандидатных структур с рангом достоверности.
  • Для чтения химических патентов: загрузить изображение структурной формулы из PDF, попросить перевести в SMILES и систематическое название — проверить результат в открытом реестре PubChem.
  • Следить за серией публикаций Anthropic «AI for Science»: это только первый white paper, дальше — ретросинтез, механизмы реакций, работа с литературой.
  • Если работаете над задачей, где мультимодальное химическое рассуждение могло бы помочь, Anthropic принимает заявки через программу AI for Science — контакт указан в оригинальной публикации.
«Opus 4.7 — модель общего назначения без химической дообучки — теперь сопоставима или превосходит ChemDraw и MestReNova в среднем. И только она может работать в обратную сторону: предлагать структуру по ЯМР-данным» — из white paper Anthropic.
← Все статьи