Blog

Knowledge WIKI

335 posts, 122-133 showing

11 / 28

Search & Retrieval

Gemini Embedding 2는 텍스트·이미지·비디오·오디오를 하나의 검색...

Google DeepMind의 Gemini Embedding 2 논문과 공식 문서를 바탕으로, 네이티브 멀티모달 임베딩 모델이 RAG·검색·추천 인프라에서 어떤 의미를 갖는지 정리한다.

Sangmin Lee2026.05.29

Foundation Models

LocateAnything는 박스를 토큰이 아니라 원자 단위로 디코딩한다

NVIDIA LocateAnything-3B는 시각 grounding과 detection에서 좌표를 토큰별로 순차 생성하던 병목을 Parallel Box Decoding으로 바꿔, 박스·포인트를 하나의 기하 단위...

Sangmin Lee2026.05.29

Model Training

NoisyAgent는 에이전트를 노이즈 속에서 학습시킨다

NoisyAgent는 user/tool noise를 agentic RL rollout에 통제적으로 주입해, 깨끗한 벤치마크 성능과 실제 환경 robustness 사이의 간극을 줄이려는 에이전트 학습 프레임워크다.

Sangmin Lee2026.05.29

Search & Retrieval

AKT-Rec는 롱테일 추천을 head-to-tail 비대칭 전이 문제로 본다

arXiv 2605.23310 AKT-Rec 논문을 바탕으로, LLM 생성 semantic ID와 RQ-VAE cluster를 이용해 헤드 사용자·상품 지식을 롱테일 추천으로 옮기는 산업용 CTR 추천 프레임워크...

Sangmin Lee2026.05.29

Materials Science

교대 페리자성은 알터자석에 조절 가능한 순자화를 더한다

arXiv 2605.22319는 2D V2Te2O 계열에서 알터자성의 운동량 의존 스핀 분할과 페리자성의 유한 순자화를 함께 갖는 교대 페리자성을 제안하고, strain으로 half-metallicity와 val...

Sangmin Lee2026.05.29

Model Training

DualOptim+는 LLM 언러닝의 optimizer state를 공유와 분리...

DualOptim+는 forget·retain 목표의 공통 성분은 base state로 공유하고 충돌하는 잔차는 delta state로 분리해, LLM machine unlearning의 망각-유틸리티 균형을 개...

Sangmin Lee2026.05.29

Model Training

효율적 코딩은 왜 신경계를 임계성과 sloppiness로 밀어 넣는가

arXiv 2605.22598은 Fisher information을 자원 제약 아래 극대화하는 단순한 Gaussian population coding 모델만으로 soft mode, 긴 상관 길이, critical...

Sangmin Lee2026.05.29

Agent Systems

Enactive AI는 에이전트를 ‘세계와 맞물려 배우는 시스템’으로 다시 묻는...

Rafiee와 Sutton의 arXiv 2605.24238은 경험, 행동-지각 불가분성, 자율성, 체화라는 네 개념으로 LLM과 RL 이후의 에이전트 설계를 재해석한다.

Sangmin Lee2026.05.29

Inference Systems

ThriftAttention은 긴 컨텍스트 FP4 어텐션을 선택적 혼합정밀로 보...

ThriftAttention은 Blackwell FP4 어텐션의 장기 컨텍스트 품질 저하를 전체 고정밀 계산이 아니라 중요한 query-key block만 FP16으로 승격하는 선택적 혼합정밀 방식으로 줄이려는...

Sangmin Lee2026.05.29

Model Training

ProAct는 에이전트의 lookahead를 환경에 접지해 학습시킨다

ProAct는 LLM 에이전트의 내부 미래 시뮬레이션이 실제 환경과 어긋나는 simulation drift를 GLAD distillation과 MC-Critic 기반 RL로 줄이려는 agent lookahead...

Sangmin Lee2026.05.29

Foundation Models

LFM2.5-8B-A1B는 온디바이스 에이전트를 위한 MoE를 128K reas...

Liquid AI의 LFM2.5-8B-A1B는 8.3B total / 1.5B active MoE를 128K 컨텍스트, 38T 토큰 학습, 확장된 토크나이저, reasoning-only 후처리와 엣지 런타임 패키...

Sangmin Lee2026.05.29

Agent Systems

MemForest는 에이전트 메모리를 검색 문제가 아니라 쓰기 효율적인 시간 인...

MemForest는 장기 실행 LLM 에이전트의 메모리 병목을 retrieval보다 extraction·maintenance write path에서 찾고, canonical fact와 MemTree 계층형 시간...

Sangmin Lee2026.05.28