rag-anything.ru.md
docs/i18n/integrations/rag-anything.ru.md
Мультимодальный сопутствующий инструмент RAG-Anything
<!-- translations:start -->
English · 한국어 · 中文 · 日本語 · Español · Français · Deutsch
<!-- translations:end -->
RAG-Anything — мультимодальный RAG-фреймворк (на базе LightRAG), который разбирает PDF, Office-документы, изображения и формулы через MinerU/Docling/PaddleOCR. Tesserae интегрирует его и как мультимодальный конвейер загрузки (UA-стиль нативной проекции графа), и как runtime-бэкенд памяти наряду с Cognee.
Зачем использовать оба?
- Tesserae — долговременная память агентов, компиляция wiki, проекция графа.
- RAG-Anything — мультимодальная загрузка + runtime-поиск LightRAG.
Они дополняют друг друга: RAG-Anything приносит понимание PDF/Office/изображений, которого нет у текстоориентированных загрузчиков Tesserae; Tesserae сохраняет долговременную, запрашиваемую память, переживающую сессии.
Текущий рабочий процесс с низким трением
Рекомендуемый путь — мастер настройки:
tesserae project setup
Для автоматизации:
tesserae project setup \
--yes \
--with-raganything \
--install-raganything \
--raganything-parser mineru \
--run-raganything
tesserae project compile
Tesserae хранит управляемую команду обновления, а не просит пользователей придумывать ее самим:
tesserae project refresh-raganything --parser mineru
Во время компиляции Tesserae:
- проверяет, существует ли
.tesserae/external/raganything/manifest.jsonи совпадает ли он с текущим git-коммитом (через сохраненныйmeta.json#gitCommitHash); - запускает управляемую обертку обновления, если файл отсутствует/устарел или передан
--refresh-external-tools; - обнаруживает источники, не относящиеся к коду (PDF, Office-документы, изображения, markdown), и разбирает их настроенным парсером;
- записывает
manifest.json+meta.json; - продолжает обычную компиляцию памяти.
Можно принудительно выполнить все настроенные внешние команды обновления перед компиляцией:
tesserae project compile --refresh-external-tools
Ручной эквивалент
pip install 'raganything[all]'
python -m tesserae.raganything_refresh --project . --parser mineru
tesserae project compile
Нативная синхронизация графа
Tesserae нативно импортирует разобранный manifest во время compile, когда настроенный инструмент использует sync_mode: native_graph.
Нативный адаптер читает .tesserae/external/raganything/manifest.json, проецирует каждый разобранный документ в SourceFile node с метаданными мультимодальных блоков и записывает sync manifest:
.tesserae/external/raganything-sync.json
Текущее сопоставление:
| RAG-Anything | Направление Tesserae |
|---|---|
documents[*] | SourceFile node, metadata.parser="raganything" |
content_list[type=text] | сворачивается в SourceFile.description; concepts через существующий извлекатель |
content_list[type=image] | SourceFile.metadata.multimodal_blocks[] (img_path, caption) |
content_list[type=table] | SourceFile.metadata.multimodal_blocks[] (table_body, caption) |
content_list[type=equation] | SourceFile.metadata.multimodal_blocks[] и metadata.equations[] (LaTeX сохраняется) |
В каждом узле сохраняется provenance:
{"system": "rag-anything", "id": "doc-<sha256>", "type": "document", "artifact": ".tesserae/external/raganything/manifest.json"}
Runtime-бэкенд памяти
memory_backends.raganything (значение по умолчанию, создаваемое default_raganything_backend_config) сосуществует с Cognee. project ask пробует бэкенды в порядке приоритета; приоритет для каждого проекта можно задать через memory_backends.priority. RAG-Anything подключается явно (по умолчанию enabled: false); флаг настройки --with-raganything его включает.
Системные предварительные требования
- Python 3.10+ (требование RAG-Anything; сам Tesserae ориентирован на 3.9+).
- LibreOffice для разбора
.doc/.docx/.ppt/.pptx/.xls/.xlsx— устанавливается отдельно через пакетный менеджер вашей платформы. При отсутствии LibreOffice RAG-Anything пропускает Office-документы с предупреждением. - Веса моделей MinerU скачиваются при первом разборе и кешируются (~ГБ). Последующие запуски используют кеш повторно.
- OpenAI-совместимые ключи LLM/эмбеддингов/vision (
OPENAI_API_KEY,OPENAI_BASE_URL) для runtime-бэкенда памяти. Режим только парсинга ключей не требует.
Принцип сотрудничества
Tesserae остается memory compiler. RAG-Anything остается независимым сопутствующим инструментом: мультимодальный парсер + поисковый движок LightRAG.