Tag

#RAG

Rubric4Setwise는 ‘관련 문서’를 고르는 대신 ‘좋은 문서 묶음’을...

SetwiseEvalKit은 relevance·authenticity·quality부터 complementarity·redundancy·conflict, completeness·density·reachabilit...

Sangmin Lee2026.07.25

Evaluation & Benchmarks

PROBE는 환각 탐지를 한 번의 판정이 아니라 검증 과정으로 평가한다

ACL 2026 Findings의 PROBE는 LLM 환각 탐지를 claim decomposition, evidence finding, evidence evaluation, hallucination localiz...

Sangmin Lee2026.07.05

Search & Retrieval

MCompassRAG는 큰 청크 검색을 토픽 메타데이터로 다시 조준한다

arXiv 2606.18508의 MCompassRAG는 RAG의 청크 크기 trade-off를 작은 청크나 런타임 LLM reranker가 아니라, 청크별 토픽 메타데이터와 LLM-teacher distillat...

Sangmin Lee2026.06.22

Search & Retrieval

Gemini Embedding 2는 텍스트·이미지·비디오·오디오를 하나의 검색...

Google DeepMind의 Gemini Embedding 2 논문과 공식 문서를 바탕으로, 네이티브 멀티모달 임베딩 모델이 RAG·검색·추천 인프라에서 어떤 의미를 갖는지 정리한다.

Sangmin Lee2026.05.29

Search & Retrieval

RAG 청킹 최적화는 검색 단위를 설계하는 일이다

요즘IT의 PyCon Korea 2025 세션 정리를 출발점으로, RAG 청킹을 고정 토큰 수 튜닝이 아니라 문맥 보존·메타데이터·검색 비용을 함께 다루는 데이터 인프라 설계 문제로 정리한다.

Sangmin Lee2026.05.26

Search & Retrieval

FastEmbed-rs는 RAG 임베딩·리랭킹을 Rust 로컬 런타임으로 묶는다

fastembed-rs는 ONNX Runtime, Hugging Face tokenizers, 선택적 Candle 백엔드를 묶어 텍스트·희소·이미지 임베딩과 reranking을 Rust 애플리케이션 안에서 실행하...

Sangmin Lee2026.05.26

Agent Systems

6가지 Agentic Design Pattern은 에이전트를 제품 구조로 보는...

Akshay Pachaar의 LinkedIn 포스트와 Daily Dose of Data Science 인포그래픽을 출발점으로 ReAct, CodeAct, MCP 기반 tool use, self-reflection...

Sangmin Lee2026.05.26

Search & Retrieval

HNSW는 벡터 검색을 고차원 skip list로 만든다

Victoria Slocum의 HNSW 설명 포스트를 출발점으로, 벡터 DB가 brute-force 검색 대신 계층적 근접 그래프를 쓰는 이유와 M·ef·distance 튜닝의 실무적 의미를 정리한다.

Sangmin Lee2026.05.25

Search & Retrieval

ZeroEntropy Models는 검색 품질을 모델·API·배포 옵션까지 한...

ZeroEntropy의 Models 문서는 zembed-1 임베딩, zerank 계열 reranker, zsearch 검색 엔진, API 요금·rate limit·배포 옵션을 하나의 검색 품질 스택으로 보여 준다...

Sangmin Lee2026.05.25

Document Intelligence

NuExtract3는 문서 추출을 JSON과 OCR로 나누지 않는다

NuExtract3는 구조화 추출과 문서-to-Markdown OCR을 하나의 4B VLM으로 묶고, reasoning을 필요할 때만 켜는 방식으로 문서 AI 파이프라인의 비용·품질 균형점을 다시 설계한다.

Sangmin Lee2026.05.20

Search & Retrieval

Grep이 정말 충분한가: Agentic Search에서 검색보다 하네스가 성능...

arXiv 2605.15184는 LongMemEval 기반 실험으로 agentic search의 성능이 grep 대 vector만이 아니라 하네스, 도구 출력 전달 방식, 노이즈 스케일링의 결합으로 결정된다는 점...

Sangmin Lee2026.05.16

Search & Retrieval

Skill-RAG는 RAG 실패를 더 검색할지보다 어떤 실패인지 먼저 진단한다

arXiv 2604.15771의 Skill-RAG는 hidden-state prober로 검색 실패 상태를 감지하고, query rewriting·question decomposition·evidence focu...

Sangmin Lee2026.05.13

Agent Skills & Workflows

SRA는 에이전트 스킬을 프롬프트 목록에서 검색 가능한 능력 코퍼스로 바꾼다

arXiv 2604.24594는 Skill Retrieval Augmentation과 SRA-Bench를 통해 에이전트 스킬 검색·로딩·적용을 분리 평가하고, 병목이 검색 품질만이 아니라 모델의 스킬 로딩 판단에...

Sangmin Lee2026.05.11

Search & Retrieval

Demand-Driven Context는 에이전트의 실패를 지식 베이스 큐레이션...

AI Engineer 워크숍 영상의 Demand-Driven Context는 엔터프라이즈 에이전트가 실패한 지점을 관찰해 필요한 도메인 지식만 구조화하고, 지식 모놀리스를 agent-ready context bl...

Sangmin Lee2026.05.10

Search & Retrieval

PageIndex는 RAG를 벡터 검색이 아니라 문서 구조 위의 추론 문제로 바...

VectifyAI/PageIndex는 긴 문서를 청킹해 벡터 DB에 넣는 전통적 RAG 대신, 계층적 문서 인덱스와 LLM 추론으로 관련 섹션을 좁혀 가는 vectorless retrieval 프레임을 제안한다.

Sangmin Lee2026.05.09

Evaluation & Benchmarks

DeepEval은 LLM 평가를 pytest식 테스트·트레이싱·합성 데이터까지...

confident-ai/deepeval은 단순 메트릭 라이브러리를 넘어 pytest 스타일 테스트, LLM-as-a-judge, 에이전트 트레이싱, 합성 데이터 생성, 벤치마크 실행을 하나의 local-first...

Sangmin Lee2026.05.06

Search & Retrieval

CocoIndex는 에이전트의 신선한 컨텍스트를 배치가 아닌 상태 동기화 문제로...

cocoindex-io/cocoindex는 RAG와 에이전트용 인덱싱을 단순 임베딩 배치가 아니라 declarative target state와 incremental sync 문제로 재정의해, 코드·문서·회의록·...

Sangmin Lee2026.05.06

Search & Retrieval

LLM Wiki는 RAG를 축적형 지식 운영체제로 바꾸려 한다

unclejobs-ai가 포크한 LLM Wiki gist는 파일 업로드형 RAG 대신, LLM이 원문 소스를 읽고 지속적으로 갱신하는 마크다운 위키를 중간 계층으로 두어 개인·연구·팀 지식을 축적형 자산으로 운영...

Sangmin Lee2026.05.06

Search & Retrieval

Agentic RAG는 검색 문제가 아니라 운영 문제다

RAG가 데모에서 제품으로 넘어가는 순간, 질문은 어떤 검색기가 더 좋은가에서 실패한 추론을 어떻게 발견하고 복구할 것인가로 바뀐다.

Sangmin Lee2026.05.05