Руслан Демидов, генеральный директор российского интегратора iCore, рассказал в интервью программе «Технологии для бизнеса», как запросы на ИИ-инфраструктуру меняют подход к проектированию, выбору оборудования и информационной безопасности. Суть проста: то, что работало для ERP и корпоративного документооборота, не масштабируется под обучение моделей и инференс.
Контекст
iCore — системный интегратор, специализирующийся на инфраструктурных проектах для среднего и крупного бизнеса в России. Компания работает с задачами отказоустойчивости, миграций и комплексного проектирования — то есть видит реальную картину того, с чем приходят заказчики, а не только декларации о «цифровой трансформации».
Типичный ЦОД 5-10-летней давности строился под плотность мощности 3-5 кВт на стойку. Современный GPU-сервер для ИИ потребляет от 10 до 40+ кВт — в зависимости от конфигурации. Разрыв принципиальный. Большинство существующих дата-центров физически не могут обеспечить нужную электрическую мощность и охлаждение для таких нагрузок без капитальной модернизации.
Параллельно меняется модель угроз. Если раньше инфобезопасность воспринималась как отдельный бюджет и отдельная команда, то сейчас требования к ней закладываются на уровне архитектуры инфраструктуры — иначе любая серьёзная проверка или инцидент рушит весь проект.
Аналитика
Проблема не в том, что кто-то строит плохие ЦОДы. Проблема в темпе: ИИ-нагрузки выросли быстрее, чем успела адаптироваться инфраструктурная индустрия. Инвестиционный цикл строительства или модернизации ЦОД — 2-5 лет. Цикл обновления GPU-поколений — около 2 лет. Это структурный разрыв, который никуда не денется в ближайшие годы.
Для системных интеграторов это означает принципиальное изменение роли. Раньше интегратор получал ТЗ и выполнял его. Теперь — как отметил Демидов — на старте проекта часто нет чёткой постановки задачи: заказчик знает, что хочет «внедрить ИИ», но не понимает, какая нагрузка, какой объём данных, какая латентность. Интегратор превращается в архитектора требований: собирает ограничения по бюджету, доступности оборудования и ожидания разных стейкхолдеров на стороне клиента.
Для рынка СНГ это особенно актуально: дефицит GPU-инфраструктуры острее, санкционные ограничения на поставки оборудования усложняют выбор, а компетенций по проектированию high-density нагрузок катастрофически мало. Компании, которые научатся делать это системно, получают рынок на годы вперёд.
Кейсы применения в бизнесе
B2B-SaaS стартап, который хочет добавить ИИ-функции в продукт. Не строить собственную инфраструктуру — использовать облачный инференс (облачные GPU-кластеры по запросу). Но уже на этапе архитектуры заложить требования к латентности и объёму данных, которые будут обрабатываться. Это определит, когда и при каком масштабе облако станет дороже собственного железа.
Корпорация с legacy-инфраструктурой, которая хочет развернуть внутренние LLM или агентные системы. Первый шаг — аудит существующих ЦОД по плотности мощности и охлаждению. Скорее всего, потребуется либо выделенная зона high-density, либо гибридная схема: часть нагрузки — в своём периметре, тяжёлые вычисления — в специализированном ЦОД или облаке. Безопасность и соответствие требованиям регулятора встраиваются в архитектуру с нуля, не после факта.
SMB и локальный бизнес в КР/СНГ, который рассматривает ИИ-инструменты. На этом уровне инфраструктурный вопрос решается проще: API-доступ к внешним моделям или использование локально развёрнутых open-source LLM (Qwen, DeepSeek) на скромном железе. Главный риск здесь — не мощность, а безопасность данных: что уходит во внешние API, нет ли конфиденциальной информации клиентов в запросах.
Кейсы в личной жизни
Разработчик или DevOps-инженер, который хочет разобраться в теме. Стоит изучить концепцию high-density rack design и liquid cooling — это востребованная экспертиза, которой на рынке мало. Плюс понять разницу между инференс-нагрузкой и тренировочной: они предъявляют разные требования к железу и сети.
Фрилансер или технический консультант, работающий с заказчиками на ИИ-проекты. Научиться задавать правильные вопросы на старте: какой объём данных, какая частота запросов, какие требования к latency, есть ли чувствительные данные. Это отличает специалиста, который поможет заказчику не потратить бюджет впустую, от того, кто просто ставит серверы.
Студент или начинающий специалист, который думает о карьере в IT-инфраструктуре. Направление AI infrastructure engineering сейчас растёт быстрее, чем появляются специалисты. Базовый стек: сети, системы хранения, виртуализация — плюс понимание специфики GPU-кластеров и оркестрации нагрузок (Kubernetes, Slurm).
Как применить сегодня
- Если планируете ИИ-проект — первым делом оцените нагрузку: сколько запросов в секунду, какой размер контекста, нужен ли fine-tuning или только инференс. Без этого любой разговор с интегратором или облачным провайдером будет вхолостую.
- Проверьте, что уходит во внешние LLM API: никаких персональных данных клиентов, коммерческой тайны, внутренних документов без явного решения о допустимости.
- Если работаете с корпоративным заказчиком — добавьте в чеклист проекта блок «инфраструктурные ограничения»: энергомощность, охлаждение, доступность оборудования, соответствие требованиям ИБ.
- Для быстрого старта с локальными моделями — рассмотрите Ollama или аналоги: позволяют развернуть Qwen или DeepSeek на обычном рабочем железе и проверить гипотезы без инфраструктурных затрат.
- Следите за развитием стандартов по плотности мощности в ЦОД — это индикатор того, как быстро рынок адаптируется к ИИ-нагрузкам в вашем регионе.