Open source Python library
AGPL-3.0 / commercialPyMuPDF4LLM은 PyMuPDF 위에서 PDF와 문서를 Markdown, JSON, plain text로 변환해 RAG·임베딩·LLM ingest 파이프라인의 첫 단계를 빠르게 만드는 Python 라이브러리다.
- 한 줄의 `pymupdf4llm.to_markdown()` 호출로 PDF를 LLM prompt, vector store, chunker에 넣기 쉬운 Markdown으...
- Markdown뿐 아니라 JSON과 plain text를 지원하고, `page_chunks=True`로 페이지별 metadata가 붙은 chunk를 바로 만들 수 있...
- multi-column layout, table, image reference, header/footer 처리, 선택적 OCR, LlamaIndex·LangChain...
- Python 3.10 이상에서 `pip install pymupdf4llm`로 설치하며 PyMuPDF와 pymupdf-layout을 함께 맞춰 설치한다.
- 라이선스는 AGPL-3.0 또는 Artifex commercial license 구조라 proprietary RAG 제품에 넣기 전 라이선스 검토가 필요하다.
Source available desktop app
Business Source License 1.1Anything은 HWP/HWPX, Office, PDF, 이미지 OCR까지 로컬에서 인덱싱하고, 선택적으로 Gemini 기반 문서 질의응답을 붙일 수 있는 Tauri 데스크톱 문서 검색 앱이다.
- 파일명이 아니라 문서 본문으로 HWP/HWPX, Office, PDF, 이미지 OCR 결과를 검색하는 로컬 데스크톱 앱이다.
- SQLite FTS5, usearch 벡터 인덱스, KoSimCSE ONNX, PaddleOCR ONNX를 조합해 키워드·파일명·시맨틱·하이브리드 검색 모드를 제공한...
- Gemini API 키를 넣으면 인덱싱된 문서를 근거로 자연어 질의응답과 온라인 요약을 사용할 수 있지만, AI를 끄면 검색·임베딩·OCR은 로컬 중심으로 동작한다.
- 최신 Release는 Windows x64 설치 파일과 macOS Apple Silicon DMG를 제공하며, macOS는 수동 업데이트와 ad-hoc 서명 cave...
- BSL 1.1 라이선스라 비프로덕션 사용은 열려 있지만 프로덕션·상용 사용은 별도 라이선스 확인이 필요하다.
Hermes WebUI는 Hermes Agent의 대화, 세션, 작업공간 파일, 스킬, 메모리, 크론, 프로필을 브라우저와 모바일에서 다루게 해주는 Python·Vanilla JS 기반 self-hosted 웹 UI입니다.
- Hermes Agent의 CLI 경험을 세션 목록, 채팅, 작업공간 파일 브라우저가 있는 3패널 웹 UI로 옮깁니다.
- 브라우저에서 모델·프로필·워크스페이스를 바꾸고, 스킬·메모리·크론·Todo·Spaces 같은 Hermes 기능을 패널로 관리할 수 있습니다.
- 기본은 127.0.0.1 바인딩과 SSH 터널 접근이며, 외부 네트워크에 열 때는 HERMES_WEBUI_PASSWORD나 Settings의 비밀번호 설정이 사실상...
- Linux/macOS/WSL2와 Docker를 중심으로 쓰는 도구이며, native Windows bootstrap은 아직 지원 대상이 아닙니다.
- 2컨테이너 구성에서는 WebUI가 실행한 도구가 WebUI 컨테이너 안에서 돌아가므로 git/node 같은 개발 도구가 없을 수 있습니다.
Hermes Agent는 Nous Research가 공개한 MIT 오픈소스 AI 에이전트로, CLI/TUI, Telegram·Discord 같은 메시징 Gateway, 스킬·메모리·크론·Kanban 자동화, 여러 모델 pr...
- 스킬, 지속 메모리, 세션 검색을 통해 복잡한 작업에서 배운 절차를 다음 세션에 다시 불러오는 학습 루프를 강조합니다.
- CLI/TUI뿐 아니라 Telegram, Discord, Slack, WhatsApp, Signal, Email 등 메시징 Gateway를 통해 같은 에이전트를 호출...
- Nous Portal, OpenRouter, Anthropic, OpenAI Codex, Gemini, Copilot, Hugging Face, 커스텀 endpoin...
- cron, delegate_task, durable Kanban, MCP, plugins, Docker/SSH/Modal/Daytona 같은 실행 backend까지...
- 기본 local terminal은 호스트 권한으로 실행되므로 Gateway allowlist/pairing, 승인 프롬프트, secrets 분리, sandbox 설정...