5 уровней зрелости AI Second Brain

Что такое AI Second Brain

Second Brain — концепция внешней системы знаний, которая дополняет возможности человеческой памяти. В оригинальной методологии Tiago Forte (CODE: Capture, Organize, Distill, Express) это способ организации цифровой информации для личной продуктивности.

В контексте AI-агентов Second Brain превращается в систематизированную базу знаний, которую AI-ассистенты (Claude Code, Codex, OpenClaw, Cursor) могут эффективно использовать для ответов и принятия решений. Чем выше уровень зрелости такой системы, тем качественнее и полнее ответы AI.

Ниже — фреймворк из 5 уровней зрелости AI Second Brain, от простого к сложному.

Уровень 1 — Базовая маршрутизация

Роутер-файл (claw.mmd для OpenClaw, agents.mmd для Codex) + папки context/, projects/, decisions/. Файлы организованы по папкам, роутер содержит правила: «информацию обо мне ищи в этой папке».

Routing должен быть осмысленным и для человека, и для AI
При разрастании системы становится грязно — нет стандарта структуры

Подробнее: AGENTS.md — формат инструкций для AI-агентов, Сравнение контекст-файлов.

Уровень 2 — LLM Wiki

LLM Wiki по паттерну Андрея Карпаты (Karpathy): индексные файлы, концепции, источники, сравнения. Obsidian или любой Markdown-редактор для визуализации графа. AutoMemory в Claude Code для автоматического сохранения контекста.

Tool-agnostic: можно дублировать конфиги (claw.mmd → agents.mmd) для совместимости с разными инструментами
Рекомендуемый уровень для большинства задач — покрывает 80% потребностей

См. также: Заметки и личная wiki: Notion, Obsidian, Anytype, Методологии продуктивности: GTD, PARA, Zettelkasten.

OKF (Open Knowledge Format) от Google Cloud — формальная спецификация, стандартизирующая этот уровень: Open Knowledge Format (OKF).

Уровень 3 — Семантический поиск

Векторные базы данных (Pinecone, Supabase с pgvector). Пайплайн: chunking → embedding → semantic search → hybrid search → reranking. Поиск по смыслу, а не по ключевым словам.

Критическое ограничение: векторный поиск — не магия. Чанкинг теряет контекст. Из 20 чанков заметок встречи retrieval вернёт только 5 — полная картина утеряна. Embedding не заменяет полнотекстовый доступ.

Рекомендация: гибридный подход — Markdown-файлы для полного контекста + embeddings для быстрого семантического поиска.

См. также: Локальные AI-модели: Ollama, LM Studio.

Уровень 4 — Knowledge Graphs

LightRAG, GraphRAG: извлечение сущностей (люди, компании) и отношений (работает на, конкурирует с, сотрудничает). Сбор данных через AI-интервью (skill «Grill Me») для наполнения графа.

Сложность и стоимость: высокий порог входа, дорого в эксплуатации
Privacy: данные уходят к Anthropic — для конфиденциальной информации нужны локальные/opensource модели
Часто избыточно — перекрёстные ссылки в LLM Wiki решают проще

Уровень 5 — Always-On Brain OS

GBrain от Garry Tan (Y Combinator): постоянная фоновая синхронизация, обновление памяти, cron-задачи. Система работает в фоне, непрерывно интегрируя новые данные.

Риск: избыток контекста вредит качеству ответов AI. Критически важен контроль ingesting — что попадает в память, а что нет.

Разделение данных на Уровне 5

Evergreen (контекст бизнеса, решения, принципы) → в Second Brain
Шум (Slack, email, customer data) → не ингестить, но иметь доступ через внешние источники

Ключевые принципы

Reverse Engineering

Начинай с вопроса, который хочешь задать системе, и проектируй структуру данных под способ их использования. Не строй инфраструктуру ради инфраструктуры.

Минимально достаточный уровень

Нет объективно «лучшего» уровня — выбирай минимальный, который решает твою конкретную боль. Разные папки одного проекта могут находиться на разных уровнях зрелости.

Boring is Beautiful

Обычные Markdown-файлы работают отлично. Не усложняй без необходимости. Простота = надёжность.

Модель четырёх C (AIOS)

Context — данные и память
Connections — связи
Capabilities — инструменты
Cadence — ритм обновления

Для Second Brain ключевые — первые два (Context + Connections).

Практические рекомендации

Начни с вопроса: «Какую проблему я решаю?» — выбери минимальный уровень, который её закрывает. Level 2 (LLM Wiki) достаточно для большинства
Гибридный подход к поиску: Markdown-файлы для полного контекста + embeddings для быстрого семантического поиска. Не клади всё в векторы
Строгий контроль ingesting: чёткие критерии — что evergreen (в память), что временное (доступ без ingest). Slack и почта — через интеграции, не через загрузку
Tool-agnostic архитектура: дублируй конфиги для совместимости. Структура понятна и человеку, и машине
Markdown + папки + роутер покрывают 80% потребностей. Усложняй только когда текущий уровень перестаёт справляться

Проблемы и ограничения

Хаос при масштабировании (Level 1) — роутер-файл и папочная структура становятся неуправляемыми
Потеря контекста при чанкинге (Level 3) — векторный поиск возвращает фрагменты, а не полный документ
Сложность Knowledge Graphs (Level 4) — высокий порог входа, дорого, часто избыточно
Приватность (Level 4-5) — облачные LLM отправляют данные вовне; для конфиденциальной информации нужны локальные модели
Перегрузка контекстом (Level 5) — Always-On Brain рискует зашумлять релевантность
Командный Second Brain — барьер не в технологии, а в habit shift и change management

Материалы и источники

Как вырастить базу знаний от файлов до Brain OS? 5 уровней зрелости Second Brain
Forte, T. (2022) Building a Second Brain
AGENTS.md — формат инструкций для AI-агентов