LLM Wiki — паттерн базы знаний для AI-агентов

Что такое LLM Wiki

LLM Wiki — это паттерн организации знаний, в котором LLM не просто отвечает по загруженным файлам, а поддерживает постоянную wiki-базу из Markdown-страниц.

Ключевая идея: знание не пересобирается заново на каждый вопрос, а накапливается и уточняется по мере добавления новых источников.

В формулировке Andrej Karpathy это «compounding artifact»: каждая новая итерация делает базу полезнее, а не просто увеличивает объём данных.

Чем отличается от классического RAG

В типичном RAG-подходе система на каждом запросе ищет релевантные куски в сырых документах и собирает ответ заново.

В LLM Wiki между пользователем и источниками появляется промежуточный слой:

Курированная wiki с сущностями, концептами, summary-страницами и связями
Кросс-ссылки между страницами
Фиксация противоречий и обновлений при новом ingest

Итог: вместо одноразового retrieval формируется долговременный граф знаний.

Архитектура LLM Wiki

По исходному паттерну есть три слоя:

Raw sources — неизменяемые исходники (статьи, заметки, отчёты, данные)
Wiki — каталог Markdown-страниц, которые создаёт и поддерживает LLM
Schema — файл правил (например AGENTS.md/CLAUDE.md), который задаёт структуру, workflow и стандарты качества

Роли разделяются так:

Человек отвечает за выбор источников, вопросы и направление анализа
LLM отвечает за рутину: суммаризацию, перекрёстные ссылки, обновление связанных страниц, учёт изменений

Операционный цикл: ingest, query, lint

Ingest

При добавлении нового источника LLM:

читает source
создаёт/обновляет summary
правит связанные страницы сущностей и концептов
обновляет index.md
добавляет запись в log.md

Один источник может затронуть много страниц, поэтому важен контроль правил в schema.

Query

Запросы выполняются не по сырым файлам напрямую, а по текущему состоянию wiki. Полезные ответы (сравнения, выводы, новые связи) можно сохранять как новые страницы, чтобы знание продолжало накапливаться.

Lint

Периодический аудит качества wiki:

противоречия между страницами
устаревшие утверждения
страницы-сироты
отсутствующие cross-links
пробелы в покрытии тем

Зачем нужны index.md и log.md

index.md — навигационный каталог по содержанию: что есть в базе и где это лежит
log.md — хронология операций: что и когда было ingested/обновлено/проверено

Эта пара файлов делает wiki управляемой для человека и предсказуемой для агента.

Когда LLM Wiki особенно полезен

Долгие исследования с большим числом источников
Внутренние базы знаний команды (процессы, решения, контекст проектов)
Личные knowledge-системы в духе second brain
Любые сценарии, где важно накопление и пересборка знаний со временем

Ограничения и риски

Без чёткой schema-конвенции wiki быстро теряет единый стиль
При слабом контроле качества возможен drift (устаревание и конфликтные страницы)
На больших объёмах нужен аккуратный retrieval и lint-стратегия, чтобы не раздувать стоимость

Связанные материалы

Open Knowledge Format (OKF) — формализация совместимого формата для таких wiki
5 уровней зрелости AI Second Brain — место LLM Wiki в общей шкале зрелости

Материалы и источники

LLM Wiki — Andrej Karpathy (оригинальный gist)