#кластеризация

Публикаций: 1

BERTopic + LLM: автоматическая кластеризация тысяч отзывов без разметки

Инженер из Ростелеком ИТ опубликовал подробный разбор пайплайна, который превращает 119 тысяч неразмеченных отзывов в интерпретируемые темы — без единого лейбла вручную. Внутри: FRIDA-эмбеддинги, HDBSCAN, UMAP и локальная LLM для читаемых названий кластеров.

← Все статьи