← Все статьи
2026-06-14 04:02 · 🤖 AI World

SkillOpt: обученный Markdown-файл поднял GPT-5.5 на 23 балла

Microsoft совместно с тремя китайскими университетами создала метод SkillOpt — и выяснилось, что обычный Markdown-файл с оптимизированными инструкциями способен поднять GPT-5.5 на 23 балла на процедурных задачах. Никаких дообучений, никаких новых весов — только текст.

SkillOpt: обученный Markdown-файл поднял GPT-5.5 на 23 балла

Microsoft в партнёрстве с тремя китайскими университетами опубликовала метод SkillOpt: он берёт принципы из классического обучения моделей и применяет их к оптимизации инструкционных документов для AI-агентов. Результат — +23 балла для GPT-5.5 на процедурных задачах. Инструмент: один Markdown-файл. Главный сюрприз: этот файл переносится между моделями и средами — Codex, Claude Code — без адаптации.

Контекст

Сейчас в AI-индустрии идёт активный поиск ответа на вопрос: как вытащить из модели максимум без повторного обучения? Файн-тюнинг стоит дорого и требует данных. Prompt engineering — непредсказуем и держится на интуиции. SkillOpt предлагает третий путь: применить методологию обучения (итерации, сигнал ошибки, коррекция) не к весам модели, а к тексту инструкций.

Работа пришла из коллаборации Microsoft Research с академическими командами — паттерн, который часто предшествует внедрению в продукты вроде Copilot или Azure AI. Одновременно это вписывается в более широкий тренд: такие компании как Anthropic, Google и стартапы вроде LangChain давно экспериментируют с тем, как структурированные системные промпты влияют на поведение агентов.

Ключевой факт: тот же Markdown-файл работает и в Codex, и в Claude Code. Это означает, что оптимизация переносима — то есть её стоимость амортизируется сразу на несколько инструментов и моделей.

Аналитика

Прибавка в 23 балла на процедурных задачах — это не маркетинговая цифра из пресс-релиза, это бенчмарк на конкретном классе задач, где агент должен выполнять последовательности шагов. Именно этот тип задач критичен для agentic-систем: кодогенерация, автоматизация процессов, многоэтапные pipelines. Улучшение без дообучения — принципиальный момент для компаний, у которых нет ресурсов на fine-tuning.

Ещё важнее перенос между моделями. До сих пор промпты для GPT и для Claude приходилось писать по-разному: поведение, форматирование, токенизация — всё разное. Если SkillOpt действительно даёт переносимый документ, это меняет экономику multi-model стратегий. Разработать один хороший инструкционный файл — и использовать его везде.

Для AI-first компаний и студий, строящих агентные системы прямо сейчас, это сигнал: вложения в качество инструкционных документов могут давать ROI сопоставимый с вложениями в дообучение — при несравнимо меньших затратах. Это не теория: у ArdDev и похожих команд уже есть агенты с AGENTS.md, ROLE.md, CLAUDE.md — по сути, первые версии именно того, что SkillOpt пытается оптимизировать систематически.

Кейсы применения в бизнесе

B2B-SaaS стартап с агентным ядром. Команда использует Claude Code или Codex для автоматизации задач поддержки и онбординга. Вместо того чтобы тюнить модель под каждый тип запроса, можно систематически итерировать системный промпт по методологии SkillOpt: запускать агента на тестовом наборе задач, измерять ошибки, корректировать инструкцию, повторять. Ожидаемый эффект — снижение числа галлюцинаций и «застреваний» агента на 15-30% без затрат на инфраструктуру обучения.

Корпорация с legacy-стеком. Компания интегрирует LLM в существующие процессы, но не может позволить себе fine-tuning на проприетарных данных из соображений безопасности. SkillOpt-подход позволяет оптимизировать инструкции локально, не передавая данные в облако для обучения. Корпоративный compliance не нарушается — вся кастомизация живёт в документе.

SMB и локальный бизнес в КР/СНГ. Небольшая компания использует готовые AI-инструменты (ChatGPT, Claude) для автоматизации рутины: обработка заявок, формирование отчётов, ответы клиентам. Вместо дорогого консультанта — итеративная доводка системного промпта по наблюдаемым ошибкам. При наличии 20-30 тестовых кейсов это реально сделать за несколько часов самостоятельно.

Кейсы в личной жизни

Разработчик. Пишешь собственный AI-агент на Claude Code или OpenAI Codex? Заведи отдельный Markdown-файл с инструкциями для агента и веди его как «обучаемый документ»: после каждого сбоя фиксируй, что пошло не так, добавляй правило в файл. Через 2-3 недели регулярного использования агент начнёт работать заметно точнее — без единой строки дообучения.

Контент-мейкер и фрилансер. Используешь AI для написания текстов, сценариев, коммерческих предложений? Создай персональный «стиль-файл» в Markdown: голос, запрещённые слова, структура, типичные ошибки модели при работе с твоими задачами. Прогоняй этот файл как системный промпт — и получи персонального редактора, который знает твой стиль без дополнительных объяснений каждый раз.

Студент или исследователь. Работаешь с AI для разбора литературы, написания рефератов, подготовки к экзаменам? Оптимизированный инструкционный файл с контекстом твоей области, форматом ответов и типичными вопросами превращает общую модель в специализированного ассистента. Перенос между GPT и Claude означает, что один файл работает в обоих инструментах.

Как применить сегодня

  • Создай AGENT_INSTRUCTIONS.md для своего агента или рабочего процесса с AI. Опиши задачу, формат вывода, типичные ошибки, которые нужно избегать.
  • Запусти агента на 10-20 тестовых задачах. Зафиксируй ошибки и паттерны сбоев — это твой «сигнал обучения».
  • Добавь в файл правила, закрывающие каждый паттерн ошибок. Повтори тест. Итерируй минимум 3-5 раз.
  • Проверь тот же файл в другой модели (если используешь и GPT, и Claude). Если переносимость работает — масштабируй без дополнительных затрат.
  • Версионируй файл в git: история изменений инструкций — это история «обучения» агента, которую можно откатить или проанализировать.
← Все статьи