2026-06-15 04:01 · 🤖 AI World

Рио де Жанейро выпустил «свою» LLM — оказалась склейкой чужих весов

Мэрия Рио де Жанейро представила Rio-3.5-Open-397B как собственную разработку городского IT-департамента IplanRIO. Команда Nex-AGI доказала, что это element-wise merge их модели Nex и Qwen3.5-397B — никакого оригинального обучения.

14 июня 2026 года команда стартапа Nex-AGI опубликовала на GitHub подробный разбор: Rio-3.5-Open-397B, официально представленный муниципальным IT-подразделением Рио де Жанейро (IplanRIO) как «оригинальная» языковая модель на 397 млрд параметров, является прямым element-wise merge чужих весов. Формула: 0.6 × Nex-N2_pro + 0.4 × Qwen3.5-397B-A17B. Ни одного слоя, обученного командой IplanRIO, найти не удалось.

Контекст

Муниципальные и государственные LLM — нарастающий тренд: Франция строит Mistral, Индия финансирует Sarvam, страны Персидского залива инвестируют в Falcon. Латинская Америка не хотела отставать. Рио, один из крупнейших городов региона, представил Rio-3.5-Open-397B как символ технологического суверенитета — «нашу» модель, обученную на португальском языке и местных данных.

Nex-AGI — небольшой стартап, разработавший модель Nex. Qwen — флагманская серия открытых LLM от Alibaba. Оба проекта выпущены с открытыми весами, что технически позволяет делать merge — но не позволяет представлять результат как оригинальную разработку.

Merging (слияние весов) — давно известная практика в open-source сообществе: берёшь два чекпоинта, интерполируешь тензоры, получаешь модель с частично смешанными способностями. Это легитимный инструмент. Проблема не в merge — проблема в том, что merge выдали за собственный обученный продукт стоимостью, по меньшей мере, миллионы долларов вычислительных ресурсов.

Аналитика

Nex-AGI привели два независимых доказательства. Первое: при удалении хард-кодированного системного промпта «You are Rio» развёрнутая модель в 79% случаев называет себя «Nex, from Nex-AGI» — и в 0% случаев называет себя «Rio». Дословно воспроизводит фирменную «биографию» Nex-AGI. Второе: каждый весовой тензор во всех 60 слоях сети совпадает с комбинацией 0.6/0.4 с точностью до тысяч стандартных отклонений. Вероятность случайного совпадения — статистически нулевая.

История говорит о двух вещах. Во-первых, государственные AI-инициативы нередко страдают от давления «показать результат» быстро. Обучить 397B-модель с нуля — это месяцы вычислений и десятки миллионов долларов. Merge занимает часы и стоит копейки. Соблазн понятен, но это прямое введение общества и налогоплательщиков в заблуждение. Во-вторых, открытые веса создают новую юридическую серую зону: большинство открытых лицензий (включая лицензии Qwen) запрещают ложную атрибуцию, но enforcement пока слабый.

Для рынка этот случай — сигнал. По мере того как государства и корпорации наперегонки объявляют «собственные» LLM, технические инструменты верификации (анализ весов, identity probing, fingerprinting) становятся отдельной индустрией. Подобно тому как антиплагиат изменил академию, weight auditing может стать стандартом при публичных AI-закупках.

Кейсы применения в бизнесе

B2B-SaaS стартап в КР/СНГ: если вы планируете строить продукт на базе open-source LLM — явно фиксируйте в документации, какие именно базовые модели используются, под какой лицензией и что вы изменили. Это не только юридическая защита, но и доверие клиентов. Сценарий Rio показывает, что «разоблачение» технически тривиально — лучше не рисковать.

Корпорация с legacy: перед закупкой любого «самобытного» AI-решения от вендора или госструктуры — требуйте технический паспорт модели: базовая архитектура, данные предобучения, fine-tuning pipeline. Нет паспорта — нет контракта. Rio-кейс — удобный аргумент в переговорах с IT-отделом.

SMB и локальный бизнес: если вы используете публичные AI-сервисы, этот кейс напоминает: провайдер может декларировать одно, а поставлять другое. Базовый тест — промпт вида «кто ты, какую модель ты используешь?» — часто вскрывает реальную основу. Не панацея, но минимальный hygiene check.

Кейсы в личной жизни

Разработчик: если вы работаете с open-source моделями и хотите проверить происхождение чекпоинта — изучите weight merging detection: инструменты вроде анализа тензорных сигнатур и identity probing уже существуют в сообществе HuggingFace. Это практический навык, который будет востребован.

Контент-мейкер и журналист: при написании материалов о «государственных AI» или «собственных LLM» компаний — задавайте технические вопросы. Где опубликованы веса? Какой evaluation? Можно ли воспроизвести результаты? Отсутствие ответов говорит само за себя.

Студент / исследователь: merge LLM — отдельная область с растущей литературой (TIES-merging, DARE, SLERP). Понять, как работает element-wise interpolation и почему это отличается от реального обучения — значит разобраться в том, как устроены современные веса трансформеров. arXiv завален качественными работами по теме.

Как применить сегодня

Если вы оцениваете чужой AI-продукт — запустите identity probe: уберите системный промпт и спросите модель, кто она. Несовпадение — красный флаг.
При работе с open-source чекпоинтами всегда читайте лицензию (особенно Qwen, Llama, Mistral) — большинство запрещают ложную атрибуцию.
Для внутренних AI-проектов ведите model card: базовая модель, версия, что дообучали, на каких данных. Это станет стандартом при аудитах и тендерах.
Следите за репозиторием Nex-AGI на GitHub — там опубликована методология детекции merge, которую можно адаптировать для собственных нужд.
При выборе вендора с «proprietary LLM» — просите бенчмарки на независимых датасетах и сравнение с известными базовыми моделями. Аномально высокое сходство — повод задать вопросы.

«С удалённым системным промптом модель называет себя Nex 79% времени — и Rio 0% времени. Она дословно воспроизводит нашу фирменную историю» — Nex-AGI, GitHub issue, 14 июня 2026

#LLM #open source #AI-вошинг #Qwen #верификация моделей

← Все статьи