rag-anything.fr.md
docs/i18n/integrations/rag-anything.fr.md
Compagnon multimodal RAG-Anything
<!-- translations:start -->
English · 한국어 · 中文 · 日本語 · Русский · Español · Deutsch
<!-- translations:end -->
RAG-Anything est un framework RAG multimodal (basé sur LightRAG) qui parse PDF, documents Office, images et équations via MinerU/Docling/PaddleOCR. Tesserae l'intègre à la fois comme pipeline d'ingestion multimodale (projection native de graphe à la manière UA) et comme backend de mémoire d'exécution aux côtés de Cognee.
Pourquoi utiliser les deux ?
- Tesserae — mémoire d'agent durable, compilation wiki, projection de graphe.
- RAG-Anything — ingestion multimodale + récupération d'exécution LightRAG.
Les deux se complètent : RAG-Anything apporte la compréhension PDF/Office/images que les chargeurs de sources orientés texte de Tesserae ne fournissent pas ; Tesserae conserve la mémoire durable et interrogeable qui survit aux sessions.
Workflow actuel à faible friction
Le chemin recommandé est l'assistant de configuration :
tesserae project setup
Pour l'automatisation :
tesserae project setup \
--yes \
--with-raganything \
--install-raganything \
--raganything-parser mineru \
--run-raganything
tesserae project compile
Tesserae stocke une commande de rafraîchissement gérée plutôt que de demander aux utilisateurs d'en inventer une :
tesserae project refresh-raganything --parser mineru
Pendant la compilation, Tesserae :
- vérifie si
.tesserae/external/raganything/manifest.jsonexiste et correspond au commit git courant (via lemeta.json#gitCommitHashstocké) ; - exécute le wrapper de rafraîchissement géré s'il est manquant/périmé ou si
--refresh-external-toolsest passé ; - découvre les sources non-code (PDF, documents Office, images, markdown) et les parse via le parser configuré ;
- écrit
manifest.json+meta.json; - poursuit la compilation normale de la mémoire.
Vous pouvez forcer toutes les commandes de rafraîchissement externes configurées avant une compilation :
tesserae project compile --refresh-external-tools
Équivalent manuel
pip install 'raganything[all]'
python -m tesserae.raganything_refresh --project . --parser mineru
tesserae project compile
Synchronisation native du graphe
Tesserae importe nativement le manifest parsé pendant compile lorsque l'outil configuré utilise sync_mode: native_graph.
L'adaptateur natif lit .tesserae/external/raganything/manifest.json, projette chaque document parsé dans un SourceFile node avec des métadonnées de blocs multimodaux, et écrit un sync manifest :
.tesserae/external/raganything-sync.json
Mapping actuel :
| RAG-Anything | Direction Tesserae |
|---|---|
documents[*] | SourceFile node, metadata.parser="raganything" |
content_list[type=text] | replié dans SourceFile.description ; concepts via l'extracteur existant |
content_list[type=image] | SourceFile.metadata.multimodal_blocks[] (img_path, caption) |
content_list[type=table] | SourceFile.metadata.multimodal_blocks[] (table_body, caption) |
content_list[type=equation] | SourceFile.metadata.multimodal_blocks[] et metadata.equations[] (LaTeX préservé) |
La provenance est préservée sur chaque nœud :
{"system": "rag-anything", "id": "doc-<sha256>", "type": "document", "artifact": ".tesserae/external/raganything/manifest.json"}
Backend de mémoire d'exécution
memory_backends.raganything (valeur par défaut produite par default_raganything_backend_config) coexiste avec Cognee. project ask essaie les backends dans l'ordre de priorité ; la priorité par projet peut être définie via memory_backends.priority. RAG-Anything est opt-in (par défaut enabled: false) ; le flag de configuration --with-raganything l'active.
Prérequis système
- Python 3.10+ (exigence de RAG-Anything ; Tesserae lui-même cible 3.9+).
- LibreOffice pour parser
.doc/.docx/.ppt/.pptx/.xls/.xlsx— installez-le séparément via le gestionnaire de paquets de votre plateforme. RAG-Anything ignore les documents Office avec un avertissement quand LibreOffice est manquant. - Les poids du modèle MinerU sont téléchargés au premier parsing et mis en cache (~Go). Les exécutions suivantes réutilisent le cache.
- Clés LLM/embedding/vision compatibles OpenAI (
OPENAI_API_KEY,OPENAI_BASE_URL) pour le backend de mémoire d'exécution. Le mode parser-only ne nécessite pas de clés.
Principe de collaboration
Tesserae reste le memory compiler. RAG-Anything reste un compagnon indépendant : parser multimodal + moteur de récupération LightRAG.