Tag

#Deep Research

BAAI의 AREX는 provisional answer를 제약별로 감사해 accept·refine·restart를 고르고, 검증된 근거와 미해결 조건만 남기는 autonomous context update로 긴...

Sangmin Lee2026.07.25

arXiv 2606.09730의 SearchSwarm은 메인 에이전트가 언제·무엇을 subagent에게 맡기고, 받은 근거 보고서를 어떻게 검증·통합할지 학습시키는 harness-guided SFT 접근으로 30...

Sangmin Lee2026.06.14

QUEST는 8K 합성 연구 과제와 rubric tree 보상, context management, MT→SFT→RL 파이프라인으로 2B~35B 공개 딥리서치 에이전트 패밀리를 만든다.

Sangmin Lee2026.05.28

DCI는 임베딩 인덱스와 top-k 검색 API를 우회하고, 에이전트가 raw corpus를 grep·bash·read로 직접 탐색하게 만드는 검색 인터페이스 제안이다.

Sangmin Lee2026.05.25

NVIDIA의 AI-Q agent skill은 Claude Code, Codex, OpenCode 같은 범용 에이전트 하네스가 리서치 파이프라인을 직접 재구현하지 않고, 로컬 또는 사내 AI-Q 서버에 장기 리서...

Sangmin Lee2026.05.23