5.1 KB · updated 2026-05-19 · md

rag-anything.ko.md

docs/i18n/integrations/rag-anything.ko.md

RAG-Anything 멀티모달 동반 도구

<!-- translations:start -->

English · 中文 · 日本語 · Русский · Español · Français · Deutsch

<!-- translations:end -->

RAG-Anything은 PDF, Office 문서, 이미지, 수식을 MinerU/Docling/PaddleOCR을 통해 파싱하는 멀티모달 RAG 프레임워크(LightRAG 기반)입니다. Tesserae는 이를 멀티모달 수집 파이프라인(UA 스타일 네이티브 그래프 투영)이자 Cognee와 함께 동작하는 런타임 메모리 백엔드로 통합합니다.

왜 둘 다 사용하나요?

  • Tesserae — 오래 지속되는 에이전트 메모리, 위키 컴파일, 그래프 투영.
  • RAG-Anything — 멀티모달 수집 + LightRAG 런타임 검색.

둘은 서로를 보완합니다: RAG-Anything은 Tesserae의 텍스트 우선 소스 로더가 제공하지 않는 PDF/Office/이미지 이해를 가져오고, Tesserae는 세션을 가로질러 살아남는 오래 지속되며 쿼리 가능한 메모리를 유지합니다.

현재의 저마찰 워크플로

권장 경로는 설정 마법사입니다:

tesserae project setup

자동화에는 다음을 사용하세요:

tesserae project setup \
  --yes \
  --with-raganything \
  --install-raganything \
  --raganything-parser mineru \
  --run-raganything
tesserae project compile

Tesserae는 사용자가 직접 만들어내는 명령이 아니라 관리형 새로고침 명령을 저장합니다:

tesserae project refresh-raganything --parser mineru

컴파일 중 Tesserae는:

  1. .tesserae/external/raganything/manifest.json이 존재하며 현재 git 커밋과 일치하는지 확인합니다(저장된 meta.json#gitCommitHash를 통해);
  2. 없거나 오래되었거나 --refresh-external-tools가 전달된 경우 관리형 새로고침 래퍼를 실행합니다;
  3. 코드가 아닌 소스(PDF, Office 문서, 이미지, markdown)를 발견하고 구성된 파서로 파싱합니다;
  4. manifest.json + meta.json을 씁니다;
  5. 일반 메모리 컴파일을 계속합니다.

컴파일 전에 구성된 모든 외부 새로고침 명령을 강제로 실행할 수 있습니다:

tesserae project compile --refresh-external-tools

수동 등가 절차

pip install 'raganything[all]'
python -m tesserae.raganything_refresh --project . --parser mineru
tesserae project compile

네이티브 그래프 동기화

Tesserae는 구성된 도구가 sync_mode: native_graph를 사용할 때 컴파일 중 파싱된 manifest를 네이티브로 가져옵니다.

네이티브 어댑터는 .tesserae/external/raganything/manifest.json을 읽고, 파싱된 각 문서를 멀티모달 블록 메타데이터를 가진 SourceFile node로 투영한 뒤 sync manifest를 씁니다:

.tesserae/external/raganything-sync.json

현재 매핑:

RAG-AnythingTesserae 방향
documents[*]SourceFile node, metadata.parser="raganything"
content_list[type=text]SourceFile.description에 접힘; concepts는 기존 추출기를 통해
content_list[type=image]SourceFile.metadata.multimodal_blocks[] (img_path, caption)
content_list[type=table]SourceFile.metadata.multimodal_blocks[] (table_body, caption)
content_list[type=equation]SourceFile.metadata.multimodal_blocks[]metadata.equations[] (LaTeX 보존)

각 노드에 provenance가 보존됩니다:

{"system": "rag-anything", "id": "doc-<sha256>", "type": "document", "artifact": ".tesserae/external/raganything/manifest.json"}

런타임 메모리 백엔드

memory_backends.raganything(default_raganything_backend_config로 생성되는 기본값)은 Cognee와 공존합니다. project ask는 우선순위에 따라 백엔드를 시도하며, 프로젝트별 우선순위는 memory_backends.priority로 설정할 수 있습니다. RAG-Anything은 옵트인입니다(기본 enabled: false); 설정 플래그 --with-raganything이 이를 켭니다.

시스템 사전 요구사항

  • Python 3.10+ (RAG-Anything 요구사항; Tesserae 자체는 3.9+를 대상으로 함).
  • .doc/.docx/.ppt/.pptx/.xls/.xlsx 파싱을 위한 LibreOffice — 플랫폼의 패키지 관리자를 통해 별도로 설치하세요. LibreOffice가 없으면 RAG-Anything은 경고와 함께 Office 문서를 건너뜁니다.
  • MinerU 모델 가중치는 첫 파싱 시 다운로드되어 캐시됩니다(~GB). 이후 실행은 캐시를 재사용합니다.
  • 런타임 메모리 백엔드를 위한 OpenAI 호환 LLM/임베딩/비전 키(OPENAI_API_KEY, OPENAI_BASE_URL). 파서 전용 모드는 키가 필요하지 않습니다.

협업 원칙

Tesserae는 memory compiler로 남습니다. RAG-Anything은 독립적인 동반 도구로 남습니다: 멀티모달 파서 + LightRAG 검색 엔진.