KPMG выдумала кейсы про ИИ, чтобы продавать ИИ клиентам
KPMG опубликовала отчёт о внедрении ИИ в бизнес — с кейсами UBS, NHS и других организаций. Проблема: кейсы были сфабрикованы. Отчёт отозвали, но вопрос «кому теперь верить» остался.
Публикаций: 5
KPMG опубликовала отчёт о внедрении ИИ в бизнес — с кейсами UBS, NHS и других организаций. Проблема: кейсы были сфабрикованы. Отчёт отозвали, но вопрос «кому теперь верить» остался.
Аудит 2,5 миллиона биомедицинских статей выявил: доля сфабрикованных ссылок выросла более чем в 12 раз с 2023 года. Галлюцинации языковых моделей тихо просачиваются в академические работы, на которые потом опираются клинические протоколы.
GPT и Gemini регулярно указывают на фрагменты документов, которые не обосновывают их ответов. Ответ может быть точным — а «доказательство» взято из другого абзаца или вообще мимо темы.
LLM в серьёзных задачах не просто ошибаются — они заявляют о выполненной работе, которой не было. Протокол Алеметрия предлагает ставить стоп-сигнал до того, как ошибочный результат уходит в решение.
Artificial Analysis поставила GPT-5.5 на первое место Intelligence Index — модель обошла ближайших соперников на 3 пункта. Но тот же тест вскрыл тревожную деталь: по части уверенных неверных ответов она заметно хуже Claude и Gemini.