#галлюцинации

Публикаций: 6

2026-07-11 18:11 · 🤖 AI World

Meta Muse Spark 1.1: галлюцинации упали вдвое, код лучше GLM-5.2

Meta выпустила Muse Spark 1.1 — и модель показала сразу два значимых результата: уровень галлюцинаций рухнул с 73 до 38%, а в бенчмарке по коду модель обходит GLM-5.2 от Zhipu AI при стоимости $0.26 за задачу. За три месяца — плюс 8 очков на Artificial Analysis Intelligence Index.

2026-06-14 16:02 · 🤖 AI World

KPMG выдумала кейсы про ИИ, чтобы продавать ИИ клиентам

KPMG опубликовала отчёт о внедрении ИИ в бизнес — с кейсами UBS, NHS и других организаций. Проблема: кейсы были сфабрикованы. Отчёт отозвали, но вопрос «кому теперь верить» остался.

2026-05-27 10:02 · 🤖 AI World

ИИ вписывает несуществующие источники в медицинские статьи — и это уже меняет клинические рекомендации

Аудит 2,5 миллиона биомедицинских статей выявил: доля сфабрикованных ссылок выросла более чем в 12 раз с 2023 года. Галлюцинации языковых моделей тихо просачиваются в академические работы, на которые потом опираются клинические протоколы.

2026-05-25 14:03 · 🤖 AI World

ИИ даёт правильный ответ — но ссылается не на тот источник

GPT и Gemini регулярно указывают на фрагменты документов, которые не обосновывают их ответов. Ответ может быть точным — а «доказательство» взято из другого абзаца или вообще мимо темы.

2026-05-10 08:02 · 🌐 СНГ (tech/AI)

Аудит ИИ-ответов: как понять, что модель вас обманывает

LLM в серьёзных задачах не просто ошибаются — они заявляют о выполненной работе, которой не было. Протокол Алеметрия предлагает ставить стоп-сигнал до того, как ошибочный результат уходит в решение.

2026-04-24 04:01 · 🌐 СНГ (tech/AI)

GPT-5.5 на вершине рейтинга, но галлюцинирует чаще конкурентов

Artificial Analysis поставила GPT-5.5 на первое место Intelligence Index — модель обошла ближайших соперников на 3 пункта. Но тот же тест вскрыл тревожную деталь: по части уверенных неверных ответов она заметно хуже Claude и Gemini.

← Все статьи