Команда Гонконгского университета науки и технологий (HKUST) под руководством Ли Сяомэн представила модель PRET (Pan-cancer Recognition without Example Training). Она распознаёт 18 типов рака по гистологическим слайдам, опираясь только на 1–8 размеченных примеров, которые подаются в контекст во время инференса — без дообучения, без смены весов. Работа вышла в Nature Cancer.
Контекст
ИИ-патология уже несколько лет считается одной из самых перспективных ниш медицинского AI. Проблема — масштабирование. Большинство существующих моделей заточены под один тип рака, требуют тысяч размеченных снимков и отдельного цикла обучения под каждую новую задачу: скрининг, определение подтипа, сегментацию опухоли. Каждый переход — это месяцы работы патологов-аннотаторов и датасаентистов.
На фоне этого разрыв между потребностью и предложением выглядит жёстко: по открытым данным, ежегодно в мире фиксируется около 20 млн новых онкодиагнозов, а квалифицированных патологов не хватает даже в развитых системах здравоохранения. В регионах с базовой медицинской инфраструктурой — включая большую часть Центральной Азии — гистологическая диагностика и вовсе остаётся узким местом всей онкологической службы.
PRET позиционируется командой HKUST именно как ответ на этот bottleneck — универсальная модель, которую не нужно переобучать под каждый кейс.
Аналитика
Ключевое техническое решение PRET — перенос in-context learning из мира LLM в патологоанатомическую диагностику. Механика та же, что используется в больших языковых моделях: вместо дообучения модель получает несколько примеров прямо в «промпте» и выстраивает ответ, опираясь на них. PRET реализует это для визуальных медицинских данных — и это первая серьёзная демонстрация few-shot learning на таком уровне в патологии.
Цифры из исследования: 23 международных бенчмарка, данные из Китая, США и Нидерландов. В 20 из 23 задач PRET обошла специализированные алгоритмы. В 15 задачах AUC превысил 0,97. При детекции метастазов в лимфоузлах модель с восемью эталонными слайдами достигла AUC 0,9871 — против среднего ~0,81 у панели из 11 врачей-патологов на тех же данных. В скрининге колоректального рака — AUC 1,00.
Важно понимать ограничения: PRET — исследовательский прототип. Бенчмарки отобраны, реальная клиническая практика грубее: разное качество окраски, разные сканеры, артефакты, редкие случаи. Авторы планируют расширять систему на предсказание мутаций и прогнозирование исходов — и там few-shot может не хватить, потому что задача требует понимания биологии опухоли, а не только визуальных паттернов. Путь от arXiv/Nature Cancer до клинической валидации — длинный. Но сама архитектурная идея значима уже сейчас.
Кейсы применения в бизнесе
MedTech-стартап / B2B-SaaS в здравоохранении. Если вы строите диагностический продукт на основе патоморфологии, PRET-подобная архитектура позволяет добавлять новые типы опухолей без переобучения. Для инвесторов это означает принципиально другой unit economics: аннотация 8 слайдов вместо тысяч. Сценарий — запустить пилот с региональным онкодиспансером, валидировать на локальных данных, получить первые клинические результаты за 3–6 месяцев.
Корпорация с legacy в диагностике. Крупные лаборатории и медцентры, у которых уже есть цифровые архивы гистологических стёкол, могут протестировать few-shot модели для второго мнения или triaging. Не заменять патолога, а фильтровать поток: AI первым смотрит слайды, патолог разбирает только флаги высокого риска и сомнительные случаи. Выигрыш — пропускная способность, снижение нагрузки на специалиста.
Региональный медицинский провайдер (КР/СНГ). Дефицит патологов в регионе — структурная проблема. PRET-подобный инструмент можно рассматривать как телепатологическую платформу: оцифрованный слайд отправляется в облако, модель выдаёт предварительное заключение, узкий специалист верифицирует удалённо. Это реальный сценарий для государственно-частного партнёрства в рамках цифровизации здравоохранения.
Кейсы в личной жизни
Разработчик, интересующийся медицинским AI. PRET — хороший пример применения трансформерных архитектур и контекстного обучения вне NLP. Если вы понимаете механику attention и few-shot в LLM, стоит прочитать оригинальную статью в Nature Cancer: архитектура переносима на другие задачи компьютерного зрения, где размеченных данных мало по определению.
Медик, работающий с цифровой патологией. Следите за open-source имплементациями в духе PRET — они появятся. Уже сейчас есть смысл начать оцифровку архивных стёкол, если клиника этого ещё не делает: это инвестиция в данные, которые станут основой для любой будущей AI-диагностики.
Студент медицинской или data science специальности. Тема few-shot learning в медицинском imaging — активная исследовательская ниша с низкой конкуренцией вне топ-10 университетов. Репозиторий HKUST, бенчмарки из статьи и смежные работы по MIL (multiple instance learning) — готовая точка входа для курсовой или первой публикации.
Как применить сегодня
- Прочитать оригинальную публикацию в Nature Cancer — искать по запросу «PRET pan-cancer recognition HKUST» на PubMed или Google Scholar.
- Если вы в MedTech: изучить открытые датасеты TCGA (The Cancer Genome Atlas) — именно на них обучались многие патологические модели, и именно с них стоит начинать экспериментировать с few-shot подходами.
- Если вы строите AI-продукт в смежных задачах (не рак, но визуальная классификация с малым числом примеров): посмотреть на архитектуру in-context learning для vision — это применимо к промышленной дефектоскопии, контролю качества, агро-диагностике.
- Для команд в КР/СНГ: проверить, какие онкодиспансеры уже используют цифровые сканеры слайдов — это первый шаг к пилоту. Часто оказывается, что оборудование есть, а программной надстройки нет.
- Следить за репозиторием HKUST на GitHub — код к статьям уровня Nature обычно публикуется в течение нескольких месяцев после выхода.
