S-Agent는 공간 추론을 한 장면 예측이 아니라 3D 증거 축적으로 바꾼다
S-Agent는 VLM을 의미적 planner로 두고 2D grounding, 3D lifting, 공간 expert, scene/agent memory를 결합해 multi-view·video 공간 추론을 evi...
Tag
S-Agent 태그가 붙은 글입니다.
S-Agent는 VLM을 의미적 planner로 두고 2D grounding, 3D lifting, 공간 expert, scene/agent memory를 결합해 multi-view·video 공간 추론을 evi...