#NLP

Публикаций: 4

2026-07-24 20:02 · 🤖 AI World

ClickGuard распознаёт кликбейт с точностью 91% и выдаёт спойлер вместо перехода

Группа польских исследователей представила браузерное расширение ClickGuard: оно детектирует кликбейт-заголовки с F1-score 91% и сразу показывает суть статьи в двух предложениях — без перехода по ссылке. Это уже не просто фильтр, а инструмент, который меняет саму экономику кликбейт-медиа.

2026-06-05 06:02 · 🤖 AI World

Как ИИ классифицирует нерешённые задачи среди 14 000 математических проблем

Туториал на MarkTechPost показывает, как за несколько шагов построить семантический поиск и классификатор статуса «открыта / решена» для математических задач — на датасете из 14 000 исследовательских проблем. Это не абстрактная демонстрация: тот же пайплайн работает на любом корпусе научных текстов, патентных баз или продуктовых баг-трекеров.

2026-05-17 00:01 · 🌐 СНГ (tech/AI)

BERTopic + LLM: автоматическая кластеризация тысяч отзывов без разметки

Инженер из Ростелеком ИТ опубликовал подробный разбор пайплайна, который превращает 119 тысяч неразмеченных отзывов в интерпретируемые темы — без единого лейбла вручную. Внутри: FRIDA-эмбеддинги, HDBSCAN, UMAP и локальная LLM для читаемых названий кластеров.

2026-05-07 14:01 · 🌐 СНГ (tech/AI)

Почему ИИ не может посчитать буквы: токенизация изнутри

LLM видит ваш текст не как буквы и слова, а как токены — и именно это объясняет, почему модель путается в простой арифметике, коверкает слова при перевороте и иногда ведёт себя как сломанный автомат. Разбираем механику изнутри.

← Все статьи