2026-06-14 22:01 · 🤖 AI World

Google Cloud стандартизировал знания компаний для AI-агентов

Google Cloud выпустил Open Knowledge Format — минималистичную спецификацию, которая превращает разрозненную внутреннюю документацию в Markdown-файлы с YAML-заголовками, пригодные для чтения AI-агентами. По сути, это официальное оформление идеи, которую Андрей Карпатий недавно назвал «LLM Wiki».

Google Cloud представил Open Knowledge Format (OKF) — открытую спецификацию для хранения корпоративных знаний в виде Markdown-файлов с YAML frontmatter. Задача простая: чтобы AI-агент мог найти, прочитать и использовать любой документ компании — без парсинга PDF, без OCR, без самодельных пайплайнов.

Контекст

Проблема, которую решает OKF, существует в каждой команде с десятком человек. Знания компании рассыпаны: часть в Notion, часть в Confluence, часть в Google Docs, ещё часть — в голове у старшего разработчика. AI-агент, которому нужно ответить на вопрос о продукте или выполнить задачу, сталкивается с зоопарком форматов и прав доступа.

Андрей Карпатий несколько месяцев назад популяризировал концепцию «LLM Wiki» — идею писать внутреннюю документацию не для людей, а с прицелом на то, чтобы языковая модель могла её потребить напрямую: чистый Markdown, чёткая структура, никаких украшений. Google Cloud взял этот паттерн и формализовал его в виде спецификации с YAML frontmatter — метаданными в заголовке файла (название, автор, теги, дата, тип документа).

OKF позиционируется как открытый стандарт — не привязанный к Google Cloud как платформе, а переносимый в любую инфраструктуру: локальный файловый сервер, S3, GitHub, собственный RAG-пайплайн.

Аналитика

Появление OKF — симптом того, что agentic-эра перестала быть экспериментальной. Раньше компании тратили время на выбор LLM и написание промптов. Сейчас узкое место сместилось: качество знаний, которые агент получает на вход, определяет качество вывода сильнее, чем выбор модели. Мусорный контекст — мусорный ответ, вне зависимости от того, Claude или GPT-4o сидит под капотом.

Стандарт с YAML frontmatter решает конкретную техническую боль: метаданные позволяют выстраивать фильтрацию до передачи в модель. Агент не тянет весь корпус — он сначала ищет документы нужного типа, нужного отдела, нужной даты, и только потом читает. Это напрямую снижает расход токенов и повышает точность ответов в RAG-сценариях.

Важно и другое: Google Cloud выбрал Markdown — не JSON-LD, не XML, не проприетарный формат. Это решение говорит о зрелости рынка. Markdown читается людьми, индексируется Git, рендерится в любом редакторе и отлично токенизируется LLM. Попытка создать «умный» формат с нуля уже несколько раз проваливалась в истории веба — Google не стал изобретать велосипед.

Кейсы применения в бизнесе

B2B-SaaS стартап. Команда из 8 человек, вся документация в Notion. Экспортируете страницы в Markdown, добавляете YAML-заголовки (тип: процесс/продукт/клиент, статус: актуально/устарело), кладёте в GitHub-репозиторий. Подключаете RAG-агента (например, через Claude с инструментом поиска по файлам). Итог: поддержка отвечает на типовые вопросы без эскалации, онбординг нового разработчика — самостоятельный, без созвонов.

Корпорация с legacy. Сотни PDF-инструкций, Word-регламентов, разбросанных по shared-дискам. OKF-миграция здесь — не разовая акция, а пайплайн: парсер извлекает текст, скрипт добавляет frontmatter с классификацией, документы версионируются в Git. Первый результат — снижение нагрузки на внутренний helpdesk. Второй — AI-агент, который умеет ссылаться на конкретный регламент с датой и ответственным.

SMB и локальный бизнес в КР/СНГ. Небольшая компания в Бишкеке, которая автоматизирует работу с клиентами через Telegram-бота. OKF позволяет держать прайс, FAQ, условия доставки в обычных Markdown-файлах — без CMS, без базы данных. Бот читает их напрямую и отвечает актуально. Обновление знаний = редактирование текстового файла, доступно любому менеджеру.

Кейсы в личной жизни

Разработчик. Ведёшь заметки о проектах, решённых багах, архитектурных решениях в Obsidian. Добавь YAML-заголовки с тегами и датами — и твоя личная база знаний станет пригодна для Claude Projects или любого локального RAG. Вместо «где я это писал» — прямой ответ от агента со ссылкой на файл.

Контент-мейкер и фрилансер. Храни бриф клиента, tone of voice, ключевые сообщения, запрещённые слова — в Markdown-файле с frontmatter. Передавай его в контекст при каждой генерации. Агент будет помнить, что клиент не любит слово «инновация», без лишних напоминаний в каждом промпте.

Студент или исследователь. Конспекты лекций, выдержки из статей, собственные аргументы — в единой OKF-структуре. Когда приходит время писать курсовую или готовиться к защите, агент агрегирует материал по теме, а не ты листаешь папки три часа.

Как применить сегодня

Возьми одну критичную область знаний (FAQ продукта, онбординг, регламент поддержки) и конвертируй её в Markdown-файлы с YAML frontmatter: поля title, type, status, updated — минимально достаточный набор.
Положи файлы в Git-репозиторий — это даст версионирование, diff и возможность подключить любой CI/CD для автообновления.
Загрузи получившиеся файлы в Claude Projects (или аналогичный контекст) и протестируй: задавай вопросы, которые раньше требовали поиска по Confluence.
Добавь поле status: outdated в устаревшие документы — агент научится их игнорировать при поиске актуальной информации.
Для автоматизации: напиши простой скрипт на Python, который мониторит папку и при изменении файла пересчитывает векторные эмбеддинги для RAG. Это дешевле и надёжнее любой проприетарной платформы управления знаниями.

Качество ответа агента определяется качеством знаний на входе. OKF — это не технология, это гигиена. И Google Cloud просто сделал её официальной.

#Google Cloud #OKF #RAG #AI-агенты #управление знаниями

← Все статьи