Перейти к содержимому

5 уровней зрелости AI Second Brain

Second Brain — концепция внешней системы знаний, которая дополняет возможности человеческой памяти. В оригинальной методологии Tiago Forte (CODE: Capture, Organize, Distill, Express) это способ организации цифровой информации для личной продуктивности.

В контексте AI-агентов Second Brain превращается в систематизированную базу знаний, которую AI-ассистенты (Claude Code, Codex, OpenClaw, Cursor) могут эффективно использовать для ответов и принятия решений. Чем выше уровень зрелости такой системы, тем качественнее и полнее ответы AI.

Ниже — фреймворк из 5 уровней зрелости AI Second Brain, от простого к сложному.

Роутер-файл (claw.mmd для OpenClaw, agents.mmd для Codex) + папки context/, projects/, decisions/. Файлы организованы по папкам, роутер содержит правила: «информацию обо мне ищи в этой папке».

  • Routing должен быть осмысленным и для человека, и для AI
  • При разрастании системы становится грязно — нет стандарта структуры

Подробнее: AGENTS.md — формат инструкций для AI-агентов, Сравнение контекст-файлов.

LLM Wiki по паттерну Андрея Карпаты (Karpathy): индексные файлы, концепции, источники, сравнения. Obsidian или любой Markdown-редактор для визуализации графа. AutoMemory в Claude Code для автоматического сохранения контекста.

  • Tool-agnostic: можно дублировать конфиги (claw.mmdagents.mmd) для совместимости с разными инструментами
  • Рекомендуемый уровень для большинства задач — покрывает 80% потребностей

См. также: Заметки и личная wiki: Notion, Obsidian, Anytype, Методологии продуктивности: GTD, PARA, Zettelkasten.

OKF (Open Knowledge Format) от Google Cloud — формальная спецификация, стандартизирующая этот уровень: Open Knowledge Format (OKF).

Векторные базы данных (Pinecone, Supabase с pgvector). Пайплайн: chunking → embedding → semantic search → hybrid search → reranking. Поиск по смыслу, а не по ключевым словам.

Критическое ограничение: векторный поиск — не магия. Чанкинг теряет контекст. Из 20 чанков заметок встречи retrieval вернёт только 5 — полная картина утеряна. Embedding не заменяет полнотекстовый доступ.

Рекомендация: гибридный подход — Markdown-файлы для полного контекста + embeddings для быстрого семантического поиска.

См. также: Локальные AI-модели: Ollama, LM Studio.

LightRAG, GraphRAG: извлечение сущностей (люди, компании) и отношений (работает на, конкурирует с, сотрудничает). Сбор данных через AI-интервью (skill «Grill Me») для наполнения графа.

  • Сложность и стоимость: высокий порог входа, дорого в эксплуатации
  • Privacy: данные уходят к Anthropic — для конфиденциальной информации нужны локальные/opensource модели
  • Часто избыточно — перекрёстные ссылки в LLM Wiki решают проще

GBrain от Garry Tan (Y Combinator): постоянная фоновая синхронизация, обновление памяти, cron-задачи. Система работает в фоне, непрерывно интегрируя новые данные.

Риск: избыток контекста вредит качеству ответов AI. Критически важен контроль ingesting — что попадает в память, а что нет.

  • Evergreen (контекст бизнеса, решения, принципы) → в Second Brain
  • Шум (Slack, email, customer data) → не ингестить, но иметь доступ через внешние источники

Начинай с вопроса, который хочешь задать системе, и проектируй структуру данных под способ их использования. Не строй инфраструктуру ради инфраструктуры.

Нет объективно «лучшего» уровня — выбирай минимальный, который решает твою конкретную боль. Разные папки одного проекта могут находиться на разных уровнях зрелости.

Обычные Markdown-файлы работают отлично. Не усложняй без необходимости. Простота = надёжность.

  • Context — данные и память
  • Connections — связи
  • Capabilities — инструменты
  • Cadence — ритм обновления

Для Second Brain ключевые — первые два (Context + Connections).

  • Начни с вопроса: «Какую проблему я решаю?» — выбери минимальный уровень, который её закрывает. Level 2 (LLM Wiki) достаточно для большинства
  • Гибридный подход к поиску: Markdown-файлы для полного контекста + embeddings для быстрого семантического поиска. Не клади всё в векторы
  • Строгий контроль ingesting: чёткие критерии — что evergreen (в память), что временное (доступ без ingest). Slack и почта — через интеграции, не через загрузку
  • Tool-agnostic архитектура: дублируй конфиги для совместимости. Структура понятна и человеку, и машине
  • Markdown + папки + роутер покрывают 80% потребностей. Усложняй только когда текущий уровень перестаёт справляться
  • Хаос при масштабировании (Level 1) — роутер-файл и папочная структура становятся неуправляемыми
  • Потеря контекста при чанкинге (Level 3) — векторный поиск возвращает фрагменты, а не полный документ
  • Сложность Knowledge Graphs (Level 4) — высокий порог входа, дорого, часто избыточно
  • Приватность (Level 4-5) — облачные LLM отправляют данные вовне; для конфиденциальной информации нужны локальные модели
  • Перегрузка контекстом (Level 5) — Always-On Brain рискует зашумлять релевантность
  • Командный Second Brain — барьер не в технологии, а в habit shift и change management