25 июня 2026 года Qicheng Zhao, Yu Li, Qi Sun и Zheyu Yan опубликовали на arXiv препринт ResilPhase — метод ускорения инференса диффузионных трансформеров, принятый на ECCV 2026. Суть: существующие подходы к ускорению теряют качество при агрессивных коэффициентах ускорения, и авторы точно установили, почему. Эксперименты проведены на FLUX.1-dev и HunyuanVideo.
Контекст
Диффузионные трансформеры (DiT) — вычислительно дорогой класс моделей. FLUX.1-dev генерирует изображения высокого качества, HunyuanVideo работает с видео. Оба требуют значительных GPU-ресурсов на инференс, что ограничивает их применение в продакшн-сценариях с высоким трафиком. Чтобы ускорить работу, исследователи придумали класс методов «cache-then-forecast»: кешировать промежуточные представления и экстраполировать следующие шаги полиномами на основе производных, не пересчитывая их полностью.
Проблема — деградация качества при высоких коэффициентах ускорения. Авторы ResilPhase вскрыли корень: дискретная экстраполяция работает на представлениях, не выровненных с непрерывной диффузионной траекторией, и численно нестабильна. Пространственные ошибки накапливаются, производные усиливают шум, высокие порядки расходятся.
ResilPhase переформулирует задачу: вместо предсказания промежуточных фич — стабильная экстраполяция макро-траектории в пространстве обыкновенных дифференциальных уравнений (ODE). Выравнивание происходит не по фичам, а по Global Drift (GD) — эволюции состояния от начала до конца диффузии. Это устраняет рассогласование и снижает накладные расходы по памяти.
Аналитика
ResilPhase строится на трёх взаимосвязанных решениях. Первое: производные исключены полностью — вместо них безынтегральный барицентрический экстраполятор Лагранжа, который математически обходит нестабильность производных и аппроксимационные ошибки. Второе: ограниченное Phase Mapping регуляризует область экстраполяции и подавляет осциллирующий рост погрешности. Третье: всё это plug-and-play — добавляется к существующим моделям без дообучения.
Факт приёма на ECCV 2026 — рецензируемую конференцию топ-уровня по компьютерному зрению — означает: подход прошёл независимую проверку. Принятые на ECCV работы обычно публикуют код вместе с камерой, и диффузионное сообщество быстро адаптирует реализации под популярные инструменты.
Контекст шире: скорость инференса давно стала конкурентным фактором. Каждый шаг диффузии стоит GPU-времени и денег. Методы ускорения без деградации качества напрямую меняют unit-экономику AI-продуктов, построенных на генеративных моделях. Plug-and-play характер ResilPhase снижает барьер внедрения: не нужны дополнительные датасеты, долгие эксперименты с дообучением, специфическая инфраструктура.
Кейсы применения в бизнесе
B2B SaaS стартап с генерацией изображений: если продукт выдаёт иллюстрации через API на основе FLUX.1-dev, каждое ускорение инференса — прямая экономия GPU-часов. Plug-and-play означает: не нужно переобучать модель, достаточно обновить пайплайн инференса. После публикации кода авторов — задача на несколько дней для MLops-инженера. Результат: снижение себестоимости генерации при сохранении качества, которое видит клиент.
Видеопродакшн и медиакомпании: HunyuanVideo используется для генерации видеоконтента. Для студий, применяющих подобные модели в черновом рендере или концептуальном брейнстормингe, ускорение при сохранении качества напрямую меняет экономику пайплайна. Рабочий сценарий: быстрый превью-проход с ускорением ResilPhase, финальный рендер — полная модель. Итерации быстрее, GPU-бюджет ниже.
SMB и небольшие студии в КР/СНГ: для команд, которые уже используют FLUX.1-dev через ComfyUI или локальные установки, ускорение влияет на пропускную способность рабочего дня. Меньше ждать = больше итераций за сессию. Когда подход появится в популярных нодах ComfyUI, его можно будет использовать без глубокого понимания математики за методом.
Кейсы в личной жизни
Разработчик, работающий с DiT-архитектурами: препринт открытый. Уже сейчас полезно разобраться с концепцией Global Drift и барицентрической интерполяцией — это переиспользуемые идеи для собственных экспериментов с ускорением. Паттерн «переформулируй задачу в ODE-пространстве» встречается шире, чем только в диффузионных моделях.
Контент-мейкер с локальной GPU: если запускаешь FLUX.1-dev на своём железе, ускорение инференса — это разница между долгим ожиданием и быстрым результатом. Следи за появлением реализации в ComfyUI или в библиотеке diffusers.
Студент и исследователь в области ML: работа принята на ECCV 2026, то есть будет представлена публично с разбором. Хороший момент изучить, как смена пространства — от фич к ODE — снимает целый класс численных проблем. Это методологический паттерн, который стоит добавить в инструментарий.
Как применить сегодня
- Прочитай препринт ResilPhase на arXiv — разделы про Global Drift и Phase Mapping особенно полезны, если работаешь с DiT-архитектурами или разрабатываешь пайплайны на FLUX.1.
- Следи за GitHub авторов после выхода ECCV 2026 — принятые работы конференции, как правило, сопровождаются публикацией кода.
- Если используешь FLUX.1-dev в продакшне, зафиксируй текущие метрики скорости и качества: это baseline для сравнения, когда появится реализация ResilPhase.
- Для ComfyUI-пользователей: активные методы ускорения быстро появляются в кастомных нодах — следи за тематическими сообществами и репозиториями.
- Если строишь AI-продукт на диффузионных моделях, включи мониторинг методов ускорения в R&D roadmap: это прямая статья оптимизации себестоимости генерации.