← Все статьи
2026-06-30 22:02 · 🤖 AI World

Meituan обучил 1,6 трлн параметров без единого GPU Nvidia

Китайский технологический гигант Meituan обучил LongCat-2.0 — модель на 1,6 триллиона параметров — полностью на отечественных чипах. Без единого ускорителя от Nvidia.

Meituan обучил 1,6 трлн параметров без единого GPU Nvidia

Компания Meituan опубликовала результаты обучения LongCat-2.0 — языковой модели на 1,6 триллиона параметров, созданной исключительно на китайском аппаратном обеспечении. Ни одного GPU от Nvidia. Для тех, кто следил за AI-гонкой в контексте американских экспортных ограничений, это не просто корпоративный анонс — это смена счёта в матче.

Контекст

Meituan — один из крупнейших китайских технологических холдингов: доставка еды, отели, локальные сервисы, десятки миллионов транзакций в день. За пределами Китая компанию знают меньше, чем Alibaba или ByteDance, но по масштабу данных и вычислительным ресурсам она сопоставима с любым из них. LongCat — флагманская серия LLM для внутренних и коммерческих задач компании.

Контекст критичен. С 2022 года США последовательно ужесточают экспортный контроль на передовые полупроводники: сначала A100 и H100, затем их «облегчённые» версии A800 и H800. Логика простая — замедлить китайский AI через дефицит вычислительных мощностей. Китай ответил масштабными вложениями в собственную полупроводниковую отрасль. До недавнего времени скептики настаивали: обучать модели frontier-класса на отечественном железе невозможно — слишком велик разрыв в производительности и зрелости программного стека.

LongCat-2.0 прямо опровергает этот тезис. Причём речь идёт не о маленькой экспериментальной модели, а о 1,6 триллиона параметров — масштабе, сопоставимом с крупнейшими западными frontier-системами. По всей видимости, это MoE-архитектура (Mixture of Experts): не все параметры активны одновременно, что даёт гигантский масштаб при приемлемых затратах на инференс — та же стратегия, что у Mixtral и DeepSeek.

Аналитика

Главный вывод: санкционный «чиповый потолок» для Китая перестал быть непробиваемым. Meituan не просто обучила большую модель — она замкнула полный производственный цикл: от железа до программного стека. Это значит, что китайская AI-индустрия достигла определённой инфраструктурной независимости. Если раньше экспортный контроль давал условный «выигрыш в несколько лет», теперь этот буфер сжимается быстрее, чем предполагали аналитики.

Для рынка это двойной сигнал. Во-первых, Nvidia теряет монополию на рынке AI-тренинга — и не только в Китае. Прецедент показывает другим регионам (Европа, Индия, Ближний Восток), что альтернативные чипы жизнеспособны при достаточных инвестициях. Во-вторых, AI-гонка становится по-настоящему мультиполярной: DeepSeek, Qwen, теперь Meituan — китайские лаборатории производят конкурентоспособные модели последовательно, а не эпизодически. Это уже не разовые прорывы, а устойчивый производственный ритм.

Есть и обратная сторона. Чем больше Китай демонстрирует независимость в AI, тем вероятнее новый виток ограничений — уже не только на чипы, но и на программные инструменты, облачный доступ, экспорт весов моделей. Компании, строящие AI-стек сегодня, должны закладывать в архитектуру сценарий фрагментации: западные и незападные модели и инфраструктура начинают существовать во всё более параллельных вселенных.

Кейсы применения в бизнесе

B2B SaaS стартап. Если продукт работает на LLM-инференсе, пора диверсифицировать поставщиков. Китайские frontier-модели — Qwen, DeepSeek — уже доступны через API и конкурируют по цене с западными аналогами. Оцените: какие задачи в вашем пайплайне не требуют именно GPT или Claude? Часть из них можно перевести на более дешёвый инференс без потери качества. Экономия на токенах при масштабе — от 40% до 70%.

Корпорация с legacy-инфраструктурой. Для тех, кто строит private AI deployment: выход мощных моделей, обученных на не-Nvidia железе, означает расширение спектра совместимого оборудования. Следите за тем, появятся ли веса LongCat-2.0 в открытом доступе — это может стать основой для fine-tuning под корпоративные задачи без зависимости от конкретного производителя GPU.

SMB и локальный бизнес в КР/СНГ. Прямое следствие мультиполярной AI-гонки — конкуренция снижает цены на инференс. Китайские провайдеры уже предлагают токены дешевле западных аналогов. Для компаний с ограниченными бюджетами это открывает frontier-уровень AI по подъёмной стоимости. Конкретный шаг: протестируйте DeepSeek V3 или Qwen2.5 через OpenRouter на вашей типовой задаче — анализе документов, генерации контента, классификации запросов.

Кейсы в личной жизни

Разработчик. Экосистема Qwen и DeepSeek уже сейчас предлагает модели, конкурентоспособные с GPT-4o по задачам кодинга и анализа текста. DeepSeek V3 и Qwen2.5-72B доступны через OpenRouter — это 10 минут настройки и заметно более низкая стоимость токена. Добавьте их в ротацию и сравните результаты на своих реальных задачах.

Контент-мейкер. Диверсификация AI-инструментов — страховка от зависимости. Один провайдер поднимает цены или ограничивает доступ — вы уже работаете с альтернативой. Qwen хорошо справляется с длинными текстами на русском: у него большое контекстное окно и достойный вывод на кириллице. Попробуйте его для черновиков или суммаризации — часто дешевле и быстрее привычного стека.

Студент и исследователь. LongCat-2.0 — практический контрпример тезису о непреодолимости американских санкций в AI. Если вы изучаете технологическую геополитику, AI-индустрию или международные отношения: кейс Meituan показывает, как работает реальная технологическая суверенизация — не через риторику, а через производственные мощности и инженерные решения.

Как применить сегодня

  • Добавьте DeepSeek V3 и Qwen2.5-72B в свой AI-стек через OpenRouter — 10 минут на настройку, заметная экономия на токенах.
  • Проведите аудит вашего LLM-пайплайна: какие задачи действительно требуют западных frontier-моделей, а какие можно передать на более дешёвый инференс?
  • Следите за HuggingFace на предмет появления весов LongCat-2.0 в открытом доступе — если это произойдёт, модель станет одним из мощнейших open-weights вариантов для fine-tuning.
  • Обновите vendor-стратегию с учётом риска фрагментации: закладывайте в архитектуру поддержку минимум двух независимых провайдеров моделей.
  • Если строите AI-продукт для B2B: начните тестировать ценовые сценарии с использованием китайских моделей — это уже не гипотеза, а рабочий вариант снижения unit-cost.
← Все статьи