Tips

#RAG

RAG 태그가 붙은 응용프로그램 팁입니다.

5 tips tagged #RAG, 1-4 showing
1 / 2
Open source
MIT

GBrain은 에이전트에게 Markdown 기반 장기 기억과 MCP 검색 레이어를 붙이...

garrytan/gbrain은 Markdown brain repo를 PGLite 또는 Postgres/pgvector에 동기화하고, hybrid search·skills·MCP·OAuth를 통해 Claude Code, Co...

  • Markdown brain repo를 source of truth로 두고, `gbrain sync`가 PGLite 또는 Postgres/pgvector에 pages·...
  • Claude Code와 Codex는 `claude mcp add gbrain -- gbrain serve`, `codex mcp add gbrain -- gbrain...
  • README 기준 PGLite는 zero-config 개인 brain의 기본 경로이고, 공유·대규모·멀티 머신 환경은 Supabase/self-hosted Postg...
  • 설치 표준은 `bun install -g github:garrytan/gbrain`이며, npm registry의 `gbrain` 패키지는 garrytan/gbrai...
  • 프롬프트, 회의록, 사람/회사 페이지, API-key 주변 설정, OAuth token, database URL을 다루는 장기 기억 계층이므로 검색 mode 비용,...
garrytan/gbrainSource
Open source beta
Apache-2.0

LiteParse는 로컬에서 빠르게 PDF를 텍스트·좌표로 바꾸는 경량 문서 파서다

run-llama/liteparse는 PDF·Office·이미지를 로컬에서 파싱해 텍스트, JSON bounding box, 페이지 스크린샷을 내보내는 Rust 기반 문서 파서/CLI입니다.

  • PDFium 기반 Rust core로 PDF 텍스트를 빠르게 뽑고, 선택적으로 Tesseract 또는 HTTP OCR 서버 결과를 병합합니다.
  • npm, pip, cargo 설치 경로가 모두 같은 `lit` CLI를 제공하며, Node.js/TypeScript·Python·Rust·Browser WASM 바인...
  • 텍스트뿐 아니라 JSON bounding box와 페이지 스크린샷을 내보내므로 RAG 근거 표시, visual citation, 에이전트 문서 읽기에 맞습니다.
  • Office 문서와 이미지는 LibreOffice/ImageMagick 변환 의존성이 필요하고, WASM 빌드는 브라우저 제약 때문에 기능 범위가 다릅니다.
  • 로컬 우선 도구지만 untrusted upload 서비스로 감싸면 파일 검증, sandbox, timeout, resource limit을 별도로 설계해야 합니다.
run-llama/liteparseSource
Open source beta
MIT

MarkItDown은 문서·Office·웹 자료를 LLM 친화적 Markdown으로 바...

microsoft/markitdown은 PDF, Office 문서, HTML, 이미지, 오디오, YouTube URL 등을 Markdown으로 변환해 검색·요약·RAG 전처리에 넣기 쉽게 만드는 MIT 라이선스 Python...

  • PDF, PowerPoint, Word, Excel, 이미지 EXIF/OCR, 오디오 transcription, HTML, CSV/JSON/XML, ZIP, YouT...
  • 기본은 로컬 변환이고, Azure Document Intelligence·Azure Content Understanding·LLM Vision 기반 OCR plugi...
  • CLI는 `markitdown input.pdf -o output.md`, Python API는 `MarkItDown().convert(...)`처럼 단순해서 bat...
  • PyPI `markitdown` 최신 버전은 0.1.6이고 GitHub release/tag도 v0.1.6까지 공개되어 있지만, classifier는 Beta라 장기...
  • `convert()`는 local path, URL, file/data URI를 모두 다룰 수 있으므로 서버 환경에서는 `convert_local()`, `conve...
microsoft/markitdownSource
Open source
MIT

Graphify는 AI 코딩 에이전트에게 프로젝트 지도를 만들어주는 지식 그래프 CLI...

safishamsi/graphify는 Claude Code, Codex, Hermes, Cursor, Gemini CLI 같은 AI 코딩 어시스턴트에서 프로젝트 폴더를 graph.html, GRAPH_REPORT.md, g...

  • `uv tool install graphifyy && graphify install`로 설치하는 Python 3.10+ CLI이며, PyPI 패키지명은 `graphi...
  • `/graphify .` 한 번으로 `graph.html`, `GRAPH_REPORT.md`, `graph.json`을 만들고, 이후 에이전트가 raw grep보다...
  • 코드는 tree-sitter AST로 로컬 추출하고, 문서·PDF·이미지 등 의미 추출은 사용 중인 AI assistant/model API를 통과할 수 있어 데이터...
  • Claude Code, Codex, OpenCode, Cursor, Gemini CLI, GitHub Copilot CLI, VS Code Copilot Chat,...
  • MCP stdio server, query/path/explain 명령, call-flow HTML, wiki/Obsidian/GraphML/Neo4j export까...
safishamsi/graphifySource