Исследователи из Колумбийского университета совместно с рядом других институтов провели масштабный аудит 2,5 миллиона биомедицинских статей и зафиксировали резкий рост числа несуществующих ссылок. С 2023 года их доля увеличилась более чем в 12 раз. Фальшивые источники соответствуют теме статьи, оформлены по всем правилам цитирования — и практически неотличимы от реальных вручную. При этом 98% затронутых публикаций не получили никакой реакции от издателей.
Контекст
Академическая наука давно борется с проблемой некачественных публикаций: «мусорные» журналы, дублирование данных, постепенное размывание peer review. Но LLM добавили принципиально новый вектор угрозы. Языковые модели не просто допускают ошибки — они генерируют правдоподобный вымысел. Несуществующая статья с реальными авторами, корректным DOI-форматом и убедительным заголовком — это не опечатка, это структурный сбой в системе верификации знания.
Биомедицина выбрана исследователями не случайно. Именно здесь цепочка «статья → мета-анализ → клинические рекомендации → протокол лечения» работает наиболее жёстко. Если в основании этой цепочки лежит сфабрикованный источник, ошибка масштабируется вплоть до стандартов, по которым врачи принимают решения о лечении пациентов.
Широкое распространение инструментов вроде ChatGPT, Claude и специализированных академических ассистентов среди учёных началось именно в 2022–2023 годах — что хронологически совпадает со скачком в статистике. Прямая причинно-следственная связь ещё не доказана, но паттерн слишком очевиден, чтобы его игнорировать.
Аналитика
Проблема глубже, чем кажется. Дело не только в недобросовестных авторах, которые используют ИИ для генерации «библиографии». Значительная часть случаев, вероятно, возникает непреднамеренно: исследователь просит модель помочь с обзором литературы, модель уверенно выдаёт несуществующие работы, автор не проверяет каждую ссылку вручную. Это системная уязвимость, а не индивидуальный порок.
Факт, что 98% случаев остались без реакции издателей, говорит о двух вещах одновременно. Во-первых, у академических журналов нет инструментов автоматической верификации ссылок в промышленном масштабе. Во-вторых, стимулы выстроены неправильно: отзыв статьи — репутационные потери для журнала, молчание — ничего. Рецензенты физически не могут проверить десятки источников в каждой из сотен поступающих статей.
Долгосрочное последствие — эрозия доверия к академическому знанию как таковому. Если читатель не может отличить реальный источник от галлюцинированного, весь массив литературы становится менее надёжным. Парадокс: чем активнее ИИ используется для ускорения науки, тем сложнее верифицировать её результаты.
Кейсы применения в бизнесе
B2B-SaaS стартап в MedTech или LegalTech. Если ваш продукт опирается на регуляторные документы, клинические протоколы или юридические прецеденты — добавьте в пайплайн слой верификации ссылок. Это может быть интеграция с CrossRef API или PubMed для проверки DOI в реальном времени. Стоимость — минимальная, но это становится конкурентным преимуществом и частью compliance-нарратива для корпоративных клиентов.
Корпорация с R&D-отделом. Если аналитики используют LLM для обзора литературы (а они уже используют, признают они это или нет), введите обязательный шаг: каждая ссылка, сгенерированная ИИ, проверяется в базе данных вручную или через скрипт. Это не недоверие к ИИ — это обычная гигиена источников. Можно оформить как внутренний стандарт работы с AI-ассистентами.
Консалтинговая или исследовательская компания в КР/СНГ. Если вы готовите аналитику для клиентов на основе международных отчётов и статей — ваши клиенты доверяют вам верификацию. Прямо сейчас это можно превратить в услугу: «аудит ИИ-генерированных материалов на достоверность источников». Спрос только формируется, ниша пустая.
Кейсы в личной жизни
Исследователь или студент магистратуры. Никогда не вставляйте ссылку из ответа ChatGPT или Claude прямо в текст. Алгоритм прост: получили ссылку от модели → открыли PubMed/Google Scholar → убедились, что статья существует → проверили, что в ней написано то, что модель утверждала. Это занимает 2 минуты на источник и защищает от профессионального позора.
Контент-мейкер или журналист, пишущий о науке. Если берёте данные из академических материалов через ИИ-инструменты — CrossRef и Semantic Scholar дают бесплатный API. Простой скрипт на Python позволяет проверить список DOI за секунды. Это не паранойя, а стандарт работы с ИИ-ассистентами в 2026 году.
Врач или медицинский специалист. Клинические рекомендации, на которые вы опираетесь, могут содержать источники, которых не существует. Это не повод отказываться от доказательной медицины — это повод чуть внимательнее смотреть на первоисточники в критических решениях. Особенно если рекомендация датирована 2023–2026 годами.
Как применить сегодня
- Если вы используете LLM для работы с литературой — установите правило: каждая ссылка проверяется через PubMed, CrossRef или Google Scholar до вставки в текст.
- Для автоматизации: скрипт на Python с библиотекой
habanero(CrossRef API) проверяет список DOI за минуту. - При использовании Claude или GPT для обзора литературы — запрашивайте только темы и ключевые слова для поиска, а не готовые ссылки. Пусть модель помогает искать, а не цитировать.
- Если вы разрабатываете AI-продукт для работы с документами — добавьте верификацию источников как обязательный шаг в UX и явно указывайте, какие ссылки проверены, а какие — нет.
- Следите за инициативами вроде Retraction Watch и базами отозванных публикаций — в скором времени появятся специализированные инструменты для детекции AI-галлюцинированных ссылок.
Галлюцинации LLM в академическом тексте — это не баг одной модели. Это системный риск, который возникает, когда инструмент с высоким уровнем уверенности встречает среду с низким уровнем верификации.