#fine-tuning

Публикаций: 11

2026-07-16 16:02 · 🤖 AI World

975B open-weights от экс-CTO OpenAI: Murati атакует рынок fine-tuning

Thinking Machines Lab Миры Мурати выпустила Inkling — мультимодальную open-weights модель на 975 миллиардов параметров. Первое место среди американских открытых моделей по Artificial Analysis Intelligence Index, но китайские конкуренты на отдельных задачах пока впереди.

2026-07-12 10:04 · 🤖 AI World

Манифест Муратти: ИИ будущего начинается с владения весами модели

Thinking Machines Lab — стартап Миры Муратти, бывшего CTO OpenAI — опубликовал манифест «The Future Worth Building Is Human». Центральный аргумент: участие человека, право собственности на веса модели и децентрализованное выравнивание — это технические задачи, а не философские рассуждения.

2026-07-11 04:03 · 🤖 AI World

GPT-5.6 Sol самостоятельно дообучил Luna — OpenAI тестирует RSI

GPT-5.6 Sol по одной расплывчатой инструкции самостоятельно дообучил модель меньшего размера Luna — без участия человека в процессе. OpenAI фиксирует прогресс во внутреннем бенчмарке RSI и называет «автоматизированного исследователя» достижимой целью.

2026-07-03 18:01 · 🤖 AI World

GPT и Claude провалили тесты Bridgewater — ответов просто не было в интернете

Один из крупнейших хедж-фондов мира протестировал топовые AI-модели на финансовых документах — и они провалились. Не потому что плохие, а потому что правильные ответы никогда не были публичными.

2026-06-19 18:01 · 🤖 AI World

Малые дозы «правильных черт»: OpenAI научила модели быть честнее

Исследователи OpenAI показали: если обучить модель на небольшом наборе примеров с «полезными чертами» — честностью и готовностью к коррекции — эффект распространяется далеко за пределы обучающего домена. Модель стала лучше на 44 из 53 бенчмарков и точнее распознаёт манипуляции.

2026-06-08 14:01 · 🤖 AI World

SafeGene: безопасность LLM как переиспользуемый модуль, а не костыль

Когда open-weight модель дообучают под задачу, она теряет защиту от вредоносных запросов — даже если обучающие данные были безвредными. Исследователи предложили SafeGene: адаптер безопасности, который не нужно пересоздавать каждый раз.

2026-06-07 14:01 · 🤖 AI World

Малые LLM не слабее — они просто забывают редкие задачи из-за частых

Исследователи нашли конкретный механизм, объясняющий, почему большие языковые модели умеют то, что маленьким не даётся. Оказалось, дело не в размере как таковом — а в том, как частые задачи вытесняют редкие из памяти модели.

2026-06-01 08:01 · 🤖 AI World

Обучение LLM в 2,81× быстрее: Trajectory открыла multi-LoRA стек для continual learning

Trajectory совместно с UC Berkeley Sky Lab и Anyscale выпустила открытый стек для параллельного обучения множества LoRA-адаптеров. Прирост пропускной способности — 2,81× по сравнению с однопоточным baseline, без потерь в качестве награды.

2026-05-26 16:01 · 🤖 AI World

Мультимодальный RLVR: строим пайплайн обучения с подкреплением для vision-LLM

Датасет Open-MM-RL от TuringEnterprises превращает обучение с подкреплением для мультимодальных моделей из исследовательской абстракции в практический пайплайн. Разбираем полный цикл: от загрузки датасета и анализа распределений до reward-функции с LaTeX-парсингом и экспорта в GRPO-формат.

2026-05-24 20:02 · 🤖 AI World

7B-модель читает документы лучше гигантов — метод ByteDance

ByteDance Seed установили: если учить мультимодальную модель отвечать на вопросы по документу вместо того, чтобы просто переписывать текст, — 7B-параметровая модель начинает стабильно обходить значительно более крупные системы. Даже на документах в 4 раза длиннее обучающей выборки.

2026-05-18 06:03 · 🌐 СНГ (tech/AI)

Компактная Gemma-3 в роботе: 270М параметров управляют гусеницей и клешнёй

Разработчик с Хабра зафайнтюнил Gemma-3 270M от Google под управление гусеничным роботом с манипулятором в симуляторе MuJoCo — модель переводит текстовые команды в JSON-инструкции для актуаторов. Весь стек умещается на Raspberry Pi Zero 2 W и обучается бесплатно на Kaggle.

← Все статьи