← Все статьи
2026-05-05 18:01 · 🌐 СНГ (tech/AI)

Архитектура сначала: как финтех строит голосовых агентов без иллюзий

Команда СВОЙ Тех разобрала реальный путь от сценарных ботов к LLM-ассистентам — и он не похож на красивые слайды. Сначала скучная архитектура, потом осторожно модели.

Архитектура сначала: как финтех строит голосовых агентов без иллюзий

Финтех-компания СВОЙ Тех опубликовала откровенный разбор того, как на самом деле внедряются голосовые AI-агенты — не на презентации инвестору, а в продакшне с регуляторными требованиями, живыми данными и реальными клиентами. Никакой магии: LLM появляется в конце, а не в начале. Рассказывает PM проекта с опытом всего цикла — от блок-схем до гибридных систем.

Контекст

Голосовые боты в финансовом секторе — давно не эксперимент. Взыскание, онбординг, справки по счетам, маршрутизация звонков — всё это уже работает на сценарных системах. СВОЙ Тех — технологическое подразделение российской финтех-группы «Свой», которое строит эти системы изнутри и набило шишки раньше, чем о них заговорили в AI-хайп-циклах.

В 2024–2025 годах рынок захлестнул нарратив «подключи LLM — получи умного агента». Это привлекательно: ответы живее, голос приятнее, demo звучит убедительно. Но в регулируемой среде — где закон прямо прописывает, что бот обязан представиться автоматизированной системой, не звонить в ночное время и всегда предлагать живого оператора — такой подход без фундамента превращается в риск, а не в преимущество.

Параллельно везде — в СНГ и за его пределами — растёт запрос на AI-агентов в B2B. Но разрыв между «работает на демо» и «работает в проде» остаётся огромным, и именно его заполняет этот материал.

Аналитика

Главная мысль статьи формулируется чётко: LLM — это слой формулировок, не слой фактов и не мозг системы. Факты приходят из API и внутренних сервисов. Правила взаимодействия задаются архитектурой. Модель отвечает за то, чтобы ответ прозвучал естественно и контекстно. Когда это разделение нарушается — система начинает галлюцинировать уверенным голосом, и в финтехе это уже compliance-инцидент.

Это прямо перекликается с более широким трендом: agentic-системы, которые реально работают в корпоративной среде, строятся по принципу «оркестратор + специализированные инструменты», а не «один LLM, который всё знает». RAG, tool use, строгие handoff-протоколы — не опции, а базовая гигиена. Команда СВОЙ Тех дошла до этого эмпирически, через рутинные итерации, а не через прочтение arxiv-статей.

Ещё один важный сигнал: сценарные боты не умирают. В задачах с юридическими ограничениями и требованиями к воспроизводимости они остаются предпочтительным инструментом — именно потому, что предсказуемы и проверяемы. LLM дополняет их там, где нужна вариативность и длинный контекст, а не заменяет целиком. Это зрелая позиция, которой не хватает большинству AI-вендоров в их питч-деках.

Кейсы применения в бизнесе

B2B-SaaS стартап, строящий голосовые агенты для SMB: соблазн — быстро подключить LLM к телефонии через API и показать demo. Реальный путь: сначала описать 5–7 ключевых маршрутов звонка в виде блок-схем, прописать интенты и пороги уверенности, интегрировать с CRM через строгий API-слой — и только потом добавлять LLM для naturalness. Результат: система, которую можно отлаживать и объяснять клиенту, а не чёрный ящик.

Корпорация с legacy-контакт-центром: тысячи сценариев, сотни исключений, команда аналитиков, которая устала обновлять скрипты. Здесь LLM решает конкретную боль — снимает нагрузку по поддержке сценариев и обрабатывает длинный хвост нестандартных запросов. Но интеграция идёт не через замену IVR, а через добавление слоя: knowledge base с версионированием, оркестратор запросов, чёткие правила handoff на оператора. Ожидаемый эффект — сокращение времени на поддержку сценариев и рост доли завершённых диалогов без эскалации.

SMB или локальный бизнес в КР/СНГ (сервис, МФО, логистика): ресурсов на full-scale архитектуру нет, но есть типовые звонки — статус заказа, подтверждение записи, напоминание об оплате. Рабочий сценарий: начать с простого сценарного бота через готовые платформы (много доступных в регионе), измерить, какие запросы не обрабатываются, и точечно добавить LLM только для этих узких мест. Не весь разговор через модель — только нестандартные ответвления.

Кейсы в личной жизни

Разработчик, который проектирует AI-агента: статья — готовый чек-лист перед началом работы. Прежде чем выбирать модель, нарисуй маршруты. Раздели источники данных (API, БД) и слой формулировок (LLM). Это сэкономит недели отладки галлюцинаций.

Продакт или PM в AI-проекте: используй слой-схему из статьи («что остаётся жёстким» vs «что отдаётся модели») для синхронизации с командой. Это не техническая документация — это инструмент выравнивания ожиданий между бизнесом и разработкой. Помогает не продавать demo как прод.

Студент или джун, изучающий agentic-системы: статья закрывает разрыв между теорией (LLM умеет всё) и практикой (LLM умеет формулировать, а данные — из систем). Прочитай перед тем, как строить первого голосового агента — сэкономишь себе месяц переделок.

Как применить сегодня

  • Прежде чем выбирать LLM-провайдера — нарисуй маршруты диалогов в виде блок-схем. Если их нет, модель не поможет.
  • Разграничь в архитектуре: факты из API → LLM только формулирует ответ. Никогда не давай модели придумывать суммы, статусы, даты.
  • Построй knowledge base как управляемый процесс: владелец, версии, метрики актуальности — не просто папка с PDF.
  • Пропиши handoff-правила заранее: при каких условиях бот передаёт на человека, как это логируется, как клиент может это запросить.
  • Измеряй не «качество модели» абстрактно, а долю завершённых сценариев, точность фактических ответов и процент успешных handoff — это реальные KPI голосового агента.
«Модель — не источник фактов и не мозг системы. Её задача — понимать речь, удерживать контекст и формулировать ответ. Когда это разделение соблюдается, всё работает предсказуемо. Когда нет — система звучит уверенно, но ошибается.»
← Все статьи