Tips

macOS / Linux

macOS와 Linux에서 바로 써볼 만한 로컬 앱, 개발 도구, 생산성 유틸리티를 정리합니다.

90 tips for macOS / Linux, 69-72 showing
18 / 23
Open source Python library
AGPL-3.0 / commercial

PyMuPDF4LLM은 PDF를 RAG용 Markdown·JSON으로 바꾸는 가벼운 P...

PyMuPDF4LLM은 PyMuPDF 위에서 PDF와 문서를 Markdown, JSON, plain text로 변환해 RAG·임베딩·LLM ingest 파이프라인의 첫 단계를 빠르게 만드는 Python 라이브러리다.

  • 한 줄의 `pymupdf4llm.to_markdown()` 호출로 PDF를 LLM prompt, vector store, chunker에 넣기 쉬운 Markdown으...
  • Markdown뿐 아니라 JSON과 plain text를 지원하고, `page_chunks=True`로 페이지별 metadata가 붙은 chunk를 바로 만들 수 있...
  • multi-column layout, table, image reference, header/footer 처리, 선택적 OCR, LlamaIndex·LangChain...
  • Python 3.10 이상에서 `pip install pymupdf4llm`로 설치하며 PyMuPDF와 pymupdf-layout을 함께 맞춰 설치한다.
  • 라이선스는 AGPL-3.0 또는 Artifex commercial license 구조라 proprietary RAG 제품에 넣기 전 라이선스 검토가 필요하다.
pymupdf/pymupdf4llmSource
Source available desktop app
Business Source License 1.1

Anything(Docufinder)는 HWP·PDF·Office 문서 내용을 로컬에서...

Anything은 HWP/HWPX, Office, PDF, 이미지 OCR까지 로컬에서 인덱싱하고, 선택적으로 Gemini 기반 문서 질의응답을 붙일 수 있는 Tauri 데스크톱 문서 검색 앱이다.

  • 파일명이 아니라 문서 본문으로 HWP/HWPX, Office, PDF, 이미지 OCR 결과를 검색하는 로컬 데스크톱 앱이다.
  • SQLite FTS5, usearch 벡터 인덱스, KoSimCSE ONNX, PaddleOCR ONNX를 조합해 키워드·파일명·시맨틱·하이브리드 검색 모드를 제공한...
  • Gemini API 키를 넣으면 인덱싱된 문서를 근거로 자연어 질의응답과 온라인 요약을 사용할 수 있지만, AI를 끄면 검색·임베딩·OCR은 로컬 중심으로 동작한다.
  • 최신 Release는 Windows x64 설치 파일과 macOS Apple Silicon DMG를 제공하며, macOS는 수동 업데이트와 ad-hoc 서명 cave...
  • BSL 1.1 라이선스라 비프로덕션 사용은 열려 있지만 프로덕션·상용 사용은 별도 라이선스 확인이 필요하다.
chrisryugj/DocufinderSource
Open source
MIT

Hermes WebUI는 Hermes Agent를 브라우저에서 다루는 self-host...

Hermes WebUI는 Hermes Agent의 대화, 세션, 작업공간 파일, 스킬, 메모리, 크론, 프로필을 브라우저와 모바일에서 다루게 해주는 Python·Vanilla JS 기반 self-hosted 웹 UI입니다.

  • Hermes Agent의 CLI 경험을 세션 목록, 채팅, 작업공간 파일 브라우저가 있는 3패널 웹 UI로 옮깁니다.
  • 브라우저에서 모델·프로필·워크스페이스를 바꾸고, 스킬·메모리·크론·Todo·Spaces 같은 Hermes 기능을 패널로 관리할 수 있습니다.
  • 기본은 127.0.0.1 바인딩과 SSH 터널 접근이며, 외부 네트워크에 열 때는 HERMES_WEBUI_PASSWORD나 Settings의 비밀번호 설정이 사실상...
  • Linux/macOS/WSL2와 Docker를 중심으로 쓰는 도구이며, native Windows bootstrap은 아직 지원 대상이 아닙니다.
  • 2컨테이너 구성에서는 WebUI가 실행한 도구가 WebUI 컨테이너 안에서 돌아가므로 git/node 같은 개발 도구가 없을 수 있습니다.
nesquena/hermes-webuiSource
Open source
MIT

Hermes Agent는 스스로 배운 절차를 축적하는 개인용 AI 런타임이다

Hermes Agent는 Nous Research가 공개한 MIT 오픈소스 AI 에이전트로, CLI/TUI, Telegram·Discord 같은 메시징 Gateway, 스킬·메모리·크론·Kanban 자동화, 여러 모델 pr...

  • 스킬, 지속 메모리, 세션 검색을 통해 복잡한 작업에서 배운 절차를 다음 세션에 다시 불러오는 학습 루프를 강조합니다.
  • CLI/TUI뿐 아니라 Telegram, Discord, Slack, WhatsApp, Signal, Email 등 메시징 Gateway를 통해 같은 에이전트를 호출...
  • Nous Portal, OpenRouter, Anthropic, OpenAI Codex, Gemini, Copilot, Hugging Face, 커스텀 endpoin...
  • cron, delegate_task, durable Kanban, MCP, plugins, Docker/SSH/Modal/Daytona 같은 실행 backend까지...
  • 기본 local terminal은 호스트 권한으로 실행되므로 Gateway allowlist/pairing, 승인 프롬프트, secrets 분리, sandbox 설정...
NousResearch/hermes-agentSource