rag-anything.es.md
docs/i18n/integrations/rag-anything.es.md
Acompañante multimodal RAG-Anything
<!-- translations:start -->
English · 한국어 · 中文 · 日本語 · Русский · Français · Deutsch
<!-- translations:end -->
RAG-Anything es un framework RAG multimodal (construido sobre LightRAG) que parsea PDFs, documentos de Office, imágenes y ecuaciones a través de MinerU/Docling/PaddleOCR. Tesserae lo integra tanto como una canalización de ingesta multimodal (proyección de grafo nativa al estilo UA) como un backend de memoria en tiempo de ejecución junto a Cognee.
¿Por qué usar ambos?
- Tesserae — memoria de agente duradera, compilación wiki, proyección de grafo.
- RAG-Anything — ingesta multimodal + recuperación en tiempo de ejecución de LightRAG.
Ambos se complementan: RAG-Anything aporta comprensión de PDF/Office/imágenes que los cargadores de fuentes orientados a texto de Tesserae no proporcionan; Tesserae conserva la memoria duradera y consultable que sobrevive entre sesiones.
Flujo actual de baja fricción
La ruta recomendada es el asistente de configuración:
tesserae project setup
Para automatización:
tesserae project setup \
--yes \
--with-raganything \
--install-raganything \
--raganything-parser mineru \
--run-raganything
tesserae project compile
Tesserae almacena un comando de actualización administrado en lugar de pedir a los usuarios que inventen uno:
tesserae project refresh-raganything --parser mineru
Durante la compilación, Tesserae:
- comprueba si
.tesserae/external/raganything/manifest.jsonexiste y coincide con el commit git actual (mediante elmeta.json#gitCommitHashalmacenado); - ejecuta el wrapper de actualización administrado si falta/está obsoleto o si se pasa
--refresh-external-tools; - descubre fuentes no de código (PDFs, documentos de Office, imágenes, markdown) y las parsea con el parser configurado;
- escribe
manifest.json+meta.json; - continúa la compilación normal de memoria.
Puedes forzar todos los comandos externos de actualización configurados antes de compilar:
tesserae project compile --refresh-external-tools
Equivalente manual
pip install 'raganything[all]'
python -m tesserae.raganything_refresh --project . --parser mineru
tesserae project compile
Sincronización nativa de grafos
Tesserae importa de forma nativa el manifest parseado durante compile cuando la herramienta configurada usa sync_mode: native_graph.
El adaptador nativo lee .tesserae/external/raganything/manifest.json, proyecta cada documento parseado en un SourceFile node con metadatos de bloques multimodales y escribe un sync manifest:
.tesserae/external/raganything-sync.json
Mapeo actual:
| RAG-Anything | Dirección de Tesserae |
|---|---|
documents[*] | SourceFile node, metadata.parser="raganything" |
content_list[type=text] | plegado en SourceFile.description; concepts vía el extractor existente |
content_list[type=image] | SourceFile.metadata.multimodal_blocks[] (img_path, caption) |
content_list[type=table] | SourceFile.metadata.multimodal_blocks[] (table_body, caption) |
content_list[type=equation] | SourceFile.metadata.multimodal_blocks[] y metadata.equations[] (LaTeX preservado) |
Se preserva la provenance en cada nodo:
{"system": "rag-anything", "id": "doc-<sha256>", "type": "document", "artifact": ".tesserae/external/raganything/manifest.json"}
Backend de memoria en tiempo de ejecución
memory_backends.raganything (predeterminado producido por default_raganything_backend_config) coexiste con Cognee. project ask prueba los backends por orden de prioridad; la prioridad por proyecto puede establecerse mediante memory_backends.priority. RAG-Anything es opcional (predeterminado enabled: false); la bandera de configuración --with-raganything lo activa.
Requisitos del sistema
- Python 3.10+ (requisito de RAG-Anything; Tesserae en sí apunta a 3.9+).
- LibreOffice para parsear
.doc/.docx/.ppt/.pptx/.xls/.xlsx— instálalo por separado mediante el gestor de paquetes de tu plataforma. RAG-Anything omite documentos de Office con una advertencia cuando falta LibreOffice. - Los pesos de modelo de MinerU se descargan en el primer parseo y se almacenan en caché (~GBs). Las ejecuciones siguientes reutilizan la caché.
- Claves de LLM/embedding/visión compatibles con OpenAI (
OPENAI_API_KEY,OPENAI_BASE_URL) para el backend de memoria en tiempo de ejecución. El modo solo parser no requiere claves.
Principio de colaboración
Tesserae sigue siendo el memory compiler. RAG-Anything sigue siendo un acompañante independiente: parser multimodal + motor de recuperación LightRAG.