Blog

Knowledge WIKI

335 posts, 50-61 showing

5 / 28

MCompassRAG는 큰 청크 검색을 토픽 메타데이터로 다시 조준한다

arXiv 2606.18508의 MCompassRAG는 RAG의 청크 크기 trade-off를 작은 청크나 런타임 LLM reranker가 아니라, 청크별 토픽 메타데이터와 LLM-teacher distillat...

Sangmin Lee2026.06.22

Foundation Models

PerceptionDLM은 여러 이미지 영역을 한 번에 설명하는 디퓨전 VLM이...

PerceptionDLM은 오토리그레시브 방식으로 영역을 하나씩 캡션하는 병목을 피하기 위해, 여러 region mask의 설명을 한 번의 디퓨전 디노이징 과정에서 병렬 생성하도록 설계한 8B급 멀티모달 diff...

Sangmin Lee2026.06.23

Agent Systems

S-Agent는 공간 추론을 한 장면 예측이 아니라 3D 증거 축적으로 바꾼다

S-Agent는 VLM을 의미적 planner로 두고 2D grounding, 3D lifting, 공간 expert, scene/agent memory를 결합해 multi-view·video 공간 추론을 evi...

Sangmin Lee2026.06.20

Foundation Models

Moebius: 0.22B 인페인팅으로 10B급 모델의 속도 장벽을 흔들다

Moebius는 LλMI 블록과 latent-space distillation으로 226M 파라미터 이미지 인페인팅 모델을 만들고, 10B급 범용 생성 모델 대비 훨씬 낮은 비용의 품질-속도 절충점을 제시한다.

Sangmin Lee2026.06.20

Inference Systems

LAMP는 AR 헤드셋의 사람 추적을 ‘월드 좌표 ray’ 문제로 바꾼다

Meta Reality Labs의 CVPR 2026 논문 LAMP는 다중 카메라 헤드셋의 2D keypoint를 6-DoF pose로 3D ray cloud에 올린 뒤, LAMP-Net으로 metric 3D hu...

Sangmin Lee2026.06.18

Foundation Models

Transformer의 문제는 컨텍스트 길이가 아니라 상태 추적의 위상일 수 있...

Google DeepMind의 arXiv 2604.17121은 feedforward Transformer가 긴 문맥 검색에는 강하지만, 시간에 따라 변하는 belief state를 반복 갱신하는 상태 추적에는 구...

Sangmin Lee2026.06.18

Research Agents

Deep Agents와 Bedrock AgentCore는 리서치 에이전트를 컨텍...

AWS와 LangChain의 예제는 웹 리서치, 코드 분석, 장기 메모리, 관측성을 별도 MicroVM과 서브에이전트 경계로 나눠 컨텍스트 압박을 줄이는 실무형 리서치 에이전트 설계를 보여준다.

Sangmin Lee2026.06.18

Model Training

NVIDIA CuTe DSL 융합 커널은 MoE 학습의 CPU·메모리 병목을 지...

NVIDIA의 CuTe DSL 기반 MoE 융합 MLP 커널은 GEMM, GLU activation, quantization, transpose를 한 커널 경로로 묶고 tokens-per-expert 정보를 GP...

Sangmin Lee2026.06.18

Foundation Models

GLM-5.2는 1M 컨텍스트를 코딩 에이전트의 운영 문제로 끌고 온다

Z.AI의 GLM-5.2는 753B MoE, 1M-token context, IndexShare sparse attention, 개선된 MTP, slime RL 인프라, anti-hack guardrail을 묶어...

Sangmin Lee2026.06.18

Inference Systems

MiniMax Sparse Attention은 100만 토큰 어텐션을 블록 선택...

MiniMax Sparse Attention은 GQA 위에 경량 Index Branch를 붙여 GQA 그룹별 Top-k KV 블록만 정확 어텐션하고, 1M 컨텍스트에서 어텐션 compute와 wall-clock...

Sangmin Lee2026.06.18

Agent Skills & Workflows

OpenClaw-Skill은 에이전트 스킬을 목록이 아니라 트리로 찾는다

arXiv 2606.16774는 여러 모델의 실행 궤적과 judge 평가를 결합해 전이 가능한 스킬 트리를 만들고, CSRL로 스킬 조건부 rollout을 비교 학습하는 OpenClaw-Skill을 제안한다.

Sangmin Lee2026.06.18

Model Training

VibeThinker-3B는 3B 모델에 검증 가능한 추론을 압축한다

WeiboAI의 VibeThinker-3B는 Qwen2.5-Coder-3B 위에 Spectrum-to-Signal post-training, 다중 도메인 RL, offline self-distillation, C...

Sangmin Lee2026.06.17