Google Cloud представил Open Knowledge Format (OKF) — открытую спецификацию для хранения корпоративных знаний в виде Markdown-файлов с YAML frontmatter. Задача простая: чтобы AI-агент мог найти, прочитать и использовать любой документ компании — без парсинга PDF, без OCR, без самодельных пайплайнов.
Контекст
Проблема, которую решает OKF, существует в каждой команде с десятком человек. Знания компании рассыпаны: часть в Notion, часть в Confluence, часть в Google Docs, ещё часть — в голове у старшего разработчика. AI-агент, которому нужно ответить на вопрос о продукте или выполнить задачу, сталкивается с зоопарком форматов и прав доступа.
Андрей Карпатий несколько месяцев назад популяризировал концепцию «LLM Wiki» — идею писать внутреннюю документацию не для людей, а с прицелом на то, чтобы языковая модель могла её потребить напрямую: чистый Markdown, чёткая структура, никаких украшений. Google Cloud взял этот паттерн и формализовал его в виде спецификации с YAML frontmatter — метаданными в заголовке файла (название, автор, теги, дата, тип документа).
OKF позиционируется как открытый стандарт — не привязанный к Google Cloud как платформе, а переносимый в любую инфраструктуру: локальный файловый сервер, S3, GitHub, собственный RAG-пайплайн.
Аналитика
Появление OKF — симптом того, что agentic-эра перестала быть экспериментальной. Раньше компании тратили время на выбор LLM и написание промптов. Сейчас узкое место сместилось: качество знаний, которые агент получает на вход, определяет качество вывода сильнее, чем выбор модели. Мусорный контекст — мусорный ответ, вне зависимости от того, Claude или GPT-4o сидит под капотом.
Стандарт с YAML frontmatter решает конкретную техническую боль: метаданные позволяют выстраивать фильтрацию до передачи в модель. Агент не тянет весь корпус — он сначала ищет документы нужного типа, нужного отдела, нужной даты, и только потом читает. Это напрямую снижает расход токенов и повышает точность ответов в RAG-сценариях.
Важно и другое: Google Cloud выбрал Markdown — не JSON-LD, не XML, не проприетарный формат. Это решение говорит о зрелости рынка. Markdown читается людьми, индексируется Git, рендерится в любом редакторе и отлично токенизируется LLM. Попытка создать «умный» формат с нуля уже несколько раз проваливалась в истории веба — Google не стал изобретать велосипед.
Кейсы применения в бизнесе
B2B-SaaS стартап. Команда из 8 человек, вся документация в Notion. Экспортируете страницы в Markdown, добавляете YAML-заголовки (тип: процесс/продукт/клиент, статус: актуально/устарело), кладёте в GitHub-репозиторий. Подключаете RAG-агента (например, через Claude с инструментом поиска по файлам). Итог: поддержка отвечает на типовые вопросы без эскалации, онбординг нового разработчика — самостоятельный, без созвонов.
Корпорация с legacy. Сотни PDF-инструкций, Word-регламентов, разбросанных по shared-дискам. OKF-миграция здесь — не разовая акция, а пайплайн: парсер извлекает текст, скрипт добавляет frontmatter с классификацией, документы версионируются в Git. Первый результат — снижение нагрузки на внутренний helpdesk. Второй — AI-агент, который умеет ссылаться на конкретный регламент с датой и ответственным.
SMB и локальный бизнес в КР/СНГ. Небольшая компания в Бишкеке, которая автоматизирует работу с клиентами через Telegram-бота. OKF позволяет держать прайс, FAQ, условия доставки в обычных Markdown-файлах — без CMS, без базы данных. Бот читает их напрямую и отвечает актуально. Обновление знаний = редактирование текстового файла, доступно любому менеджеру.
Кейсы в личной жизни
Разработчик. Ведёшь заметки о проектах, решённых багах, архитектурных решениях в Obsidian. Добавь YAML-заголовки с тегами и датами — и твоя личная база знаний станет пригодна для Claude Projects или любого локального RAG. Вместо «где я это писал» — прямой ответ от агента со ссылкой на файл.
Контент-мейкер и фрилансер. Храни бриф клиента, tone of voice, ключевые сообщения, запрещённые слова — в Markdown-файле с frontmatter. Передавай его в контекст при каждой генерации. Агент будет помнить, что клиент не любит слово «инновация», без лишних напоминаний в каждом промпте.
Студент или исследователь. Конспекты лекций, выдержки из статей, собственные аргументы — в единой OKF-структуре. Когда приходит время писать курсовую или готовиться к защите, агент агрегирует материал по теме, а не ты листаешь папки три часа.
Как применить сегодня
- Возьми одну критичную область знаний (FAQ продукта, онбординг, регламент поддержки) и конвертируй её в Markdown-файлы с YAML frontmatter: поля
title,type,status,updated— минимально достаточный набор. - Положи файлы в Git-репозиторий — это даст версионирование, diff и возможность подключить любой CI/CD для автообновления.
- Загрузи получившиеся файлы в Claude Projects (или аналогичный контекст) и протестируй: задавай вопросы, которые раньше требовали поиска по Confluence.
- Добавь поле
status: outdatedв устаревшие документы — агент научится их игнорировать при поиске актуальной информации. - Для автоматизации: напиши простой скрипт на Python, который мониторит папку и при изменении файла пересчитывает векторные эмбеддинги для RAG. Это дешевле и надёжнее любой проприетарной платформы управления знаниями.
Качество ответа агента определяется качеством знаний на входе. OKF — это не технология, это гигиена. И Google Cloud просто сделал её официальной.