Search & Retrieval

Neo4j LLM Graph Builder는 문서를 GraphRAG용 지식 그래...

Neo4j Labs의 LLM Graph Builder를 저장소·문서·릴리스 기준으로 살펴본다. 핵심은 문서 chunk와 entity graph를 함께 만들고, 이를 Neo4j 안에서 시각화·GraphRAG·평가까...

Sangmin Lee2026.06.26

Search & Retrieval

Hyper-Extract는 비정형 문서를 타입 있는 지식 추출 파이프라인으로 바...

Hyper-Extract는 문서를 리스트·Pydantic 모델·지식 그래프·하이퍼그래프·시공간 그래프로 추출하고, CLI·Python SDK·MCP·Obsidian export까지 붙인 지식 추출 프레임워크다.

Sangmin Lee2026.06.26

Search & Retrieval

MCompassRAG는 큰 청크 검색을 토픽 메타데이터로 다시 조준한다

arXiv 2606.18508의 MCompassRAG는 RAG의 청크 크기 trade-off를 작은 청크나 런타임 LLM reranker가 아니라, 청크별 토픽 메타데이터와 LLM-teacher distillat...

Sangmin Lee2026.06.22

Search & Retrieval

SearchSwarm은 딥리서치 에이전트의 병렬화를 ‘위임 지능’ 학습 문제로...

arXiv 2606.09730의 SearchSwarm은 메인 에이전트가 언제·무엇을 subagent에게 맡기고, 받은 근거 보고서를 어떻게 검증·통합할지 학습시키는 harness-guided SFT 접근으로 30...

Sangmin Lee2026.06.14

Search & Retrieval

픽코마 팝업 추천 실험은 취향과 맥락을 어떻게 분리했나

if(kakao)2020 발표를 바탕으로, 픽코마 팝업 추천에서 개인화 추천과 연관 추천을 A/B 테스트하고 노출 타이밍·서비스 맥락까지 실험한 운영 추천 시스템 사례를 정리한다.

Sangmin Lee2026.06.10

Search & Retrieval

Harness-1은 검색 에이전트 학습을 stateful harness 문제로...

Harness-1은 20B 검색 에이전트가 긴 transcript 위에서 모든 상태를 기억하게 하는 대신, 후보 풀·curated set·검증 기록을 하네스가 관리하게 만든 RL 기반 검색 에이전트다.

Sangmin Lee2026.06.04

Search & Retrieval

Gemini Embedding 2는 텍스트·이미지·비디오·오디오를 하나의 검색...

Google DeepMind의 Gemini Embedding 2 논문과 공식 문서를 바탕으로, 네이티브 멀티모달 임베딩 모델이 RAG·검색·추천 인프라에서 어떤 의미를 갖는지 정리한다.

Sangmin Lee2026.05.29

Search & Retrieval

AKT-Rec는 롱테일 추천을 head-to-tail 비대칭 전이 문제로 본다

arXiv 2605.23310 AKT-Rec 논문을 바탕으로, LLM 생성 semantic ID와 RQ-VAE cluster를 이용해 헤드 사용자·상품 지식을 롱테일 추천으로 옮기는 산업용 CTR 추천 프레임워크...

Sangmin Lee2026.05.29

Search & Retrieval

SemBridge는 영어 중심 sparse encoder를 다국어 검색기로 옮기...

arXiv 2605.26002 SemBridge 논문을 바탕으로, 영어 vocabulary에 갇힌 sparse encoder를 Arabic·Chinese·Hindi·Korean·Russian 검색기로 이전하는 방...

Sangmin Lee2026.05.28

Search & Retrieval

RAG 청킹 최적화는 검색 단위를 설계하는 일이다

요즘IT의 PyCon Korea 2025 세션 정리를 출발점으로, RAG 청킹을 고정 토큰 수 튜닝이 아니라 문맥 보존·메타데이터·검색 비용을 함께 다루는 데이터 인프라 설계 문제로 정리한다.

Sangmin Lee2026.05.26

Search & Retrieval

FastEmbed-rs는 RAG 임베딩·리랭킹을 Rust 로컬 런타임으로 묶는다

fastembed-rs는 ONNX Runtime, Hugging Face tokenizers, 선택적 Candle 백엔드를 묶어 텍스트·희소·이미지 임베딩과 reranking을 Rust 애플리케이션 안에서 실행하...

Sangmin Lee2026.05.26

Search & Retrieval

HNSW는 벡터 검색을 고차원 skip list로 만든다

Victoria Slocum의 HNSW 설명 포스트를 출발점으로, 벡터 DB가 brute-force 검색 대신 계층적 근접 그래프를 쓰는 이유와 M·ef·distance 튜닝의 실무적 의미를 정리한다.

Sangmin Lee2026.05.25

Search & Retrieval

ctxl-rerank-v2 seq-cls는 CausalLM reranker를 표...

sigridjineth/ctxl-rerank-v2-1b-seq-cls는 Contextual AI Reranker v2 1B의 마지막 토큰 vocab_id=0 logit을 단일 SequenceClassificati...

Sangmin Lee2026.05.25

Search & Retrieval

Procrustes alignment는 embedding 모델 교체를 호환성 문...

arXiv 2510.13406은 서로 다른 embedding 모델이 pairwise dot product 구조를 비슷하게 보존한다면 직교 Procrustes 변환만으로 같은 검색·추천·멀티모달 파이프라인 안에서...

Sangmin Lee2026.05.25

Search & Retrieval

LEAF는 작은 embedding 모델을 teacher와 같은 벡터 공간에 맞춘...

LEAF는 teacher embedding을 직접 근사하는 단순한 증류 목표로 23M text embedding 모델을 만들고, 문서는 큰 teacher로 질의는 작은 leaf로 처리하는 비대칭 검색 구조까지 열...

Sangmin Lee2026.05.25

Search & Retrieval

ZeroEntropy Models는 검색 품질을 모델·API·배포 옵션까지 한...

ZeroEntropy의 Models 문서는 zembed-1 임베딩, zerank 계열 reranker, zsearch 검색 엔진, API 요금·rate limit·배포 옵션을 하나의 검색 품질 스택으로 보여 준다...

Sangmin Lee2026.05.25

Search & Retrieval

Direct Corpus Interaction은 검색 에이전트의 병목을 retr...

DCI는 임베딩 인덱스와 top-k 검색 API를 우회하고, 에이전트가 raw corpus를 grep·bash·read로 직접 탐색하게 만드는 검색 인터페이스 제안이다.

Sangmin Lee2026.05.25

Search & Retrieval

Neo4j Context Graphs는 RAG를 에이전트의 의사결정 메모리로 확...

Stephen Chin의 AI Engineer Europe 발표는 context graph를 단순 검색 보강이 아니라 단기·장기·추론 메모리와 의사결정 trace를 연결하는 에이전트 운영 계층으로 제시한다.

Sangmin Lee2026.05.23

Search & Retrieval

Ettin Reranker는 retrieve-then-rerank 스택을 작은...

Hugging Face의 ettin-reranker-v1 계열은 Ettin ModernBERT encoder 위에 17M~1B CrossEncoder를 학습해, 공개 데이터·증류 레시피·MTEB/NanoBEIR·...

Sangmin Lee2026.05.20

Search & Retrieval

Grep이 정말 충분한가: Agentic Search에서 검색보다 하네스가 성능...

arXiv 2605.15184는 LongMemEval 기반 실험으로 agentic search의 성능이 grep 대 vector만이 아니라 하네스, 도구 출력 전달 방식, 노이즈 스케일링의 결합으로 결정된다는 점...

Sangmin Lee2026.05.16

Search & Retrieval

Jina Embeddings v5 Omni는 텍스트 인덱스를 그대로 둔 채 모든...

jina-embeddings-v5-omni는 Jina v5 Text의 벡터 geometry를 보존하면서 이미지·비디오·오디오 타워를 frozen projector로 붙여, 기존 텍스트 인덱스를 멀티모달 검색 su...

Sangmin Lee2026.05.13

Search & Retrieval

OCR-Memory는 에이전트 기억을 텍스트 요약이 아니라 시각적 검색 문제로...

arXiv 2604.26622는 장기 실행 에이전트의 trajectory를 텍스트로 계속 밀어 넣는 대신, multi-resolution 이미지와 Set-of-Mark anchor로 저장하고 필요한 segment...

Sangmin Lee2026.05.13

Search & Retrieval

Skill-RAG는 RAG 실패를 더 검색할지보다 어떤 실패인지 먼저 진단한다

arXiv 2604.15771의 Skill-RAG는 hidden-state prober로 검색 실패 상태를 감지하고, query rewriting·question decomposition·evidence focu...

Sangmin Lee2026.05.13

Search & Retrieval

Demand-Driven Context는 에이전트의 실패를 지식 베이스 큐레이션...

AI Engineer 워크숍 영상의 Demand-Driven Context는 엔터프라이즈 에이전트가 실패한 지점을 관찰해 필요한 도메인 지식만 구조화하고, 지식 모놀리스를 agent-ready context bl...

Sangmin Lee2026.05.10

Search & Retrieval

PageIndex는 RAG를 벡터 검색이 아니라 문서 구조 위의 추론 문제로 바...

VectifyAI/PageIndex는 긴 문서를 청킹해 벡터 DB에 넣는 전통적 RAG 대신, 계층적 문서 인덱스와 LLM 추론으로 관련 섹션을 좁혀 가는 vectorless retrieval 프레임을 제안한다.

Sangmin Lee2026.05.09

Search & Retrieval

CocoIndex는 에이전트의 신선한 컨텍스트를 배치가 아닌 상태 동기화 문제로...

cocoindex-io/cocoindex는 RAG와 에이전트용 인덱싱을 단순 임베딩 배치가 아니라 declarative target state와 incremental sync 문제로 재정의해, 코드·문서·회의록·...

Sangmin Lee2026.05.06

Search & Retrieval

LLM Wiki는 RAG를 축적형 지식 운영체제로 바꾸려 한다

unclejobs-ai가 포크한 LLM Wiki gist는 파일 업로드형 RAG 대신, LLM이 원문 소스를 읽고 지속적으로 갱신하는 마크다운 위키를 중간 계층으로 두어 개인·연구·팀 지식을 축적형 자산으로 운영...

Sangmin Lee2026.05.06

Search & Retrieval

Agentic RAG는 검색 문제가 아니라 운영 문제다

RAG가 데모에서 제품으로 넘어가는 순간, 질문은 어떤 검색기가 더 좋은가에서 실패한 추론을 어떻게 발견하고 복구할 것인가로 바뀐다.

Sangmin Lee2026.05.05