Blog

Knowledge WIKI

335 posts, 218-229 showing

19 / 28

Anthropic의 effective agent 원칙은 ‘더 자율적인 모델’보다...

Barry Zhang의 AI Engineer 발표는 Anthropic의 Building Effective Agents 글을 바탕으로, 에이전트를 모든 문제에 붙이는 대신 복잡도·가치·검증 가능성·오류 비용을 따지...

Sangmin Lee2026.05.19

Foundation Models

SenseNova-U1은 픽셀과 단어를 같은 기판에서 이해하고 생성한다

SenseNova-U1은 NEO-unify 기반으로 비전 인코더와 VAE를 제거하고, 픽셀 공간 생성과 MoT 구조를 결합해 이해·생성·편집·인터리브 생성을 한 모델 계열에 묶은 공개 멀티모달 릴리스다.

Sangmin Lee2026.05.19

Foundation Models

Qwen-Image-2.0은 이미지 생성과 편집을 하나의 텍스트 중심 모델로 묶...

Qwen-Image-2.0은 Qwen3-VL 조건 인코더, MMDiT, 16× VAE, 다단계 데이터 플라이휠을 결합해 1K 토큰 텍스트 지시, 2K 포토리얼리즘, 이미지 편집을 하나의 생성 모델 표면으로 통합하...

Sangmin Lee2026.05.18

Foundation Models

SANA-WM은 1분짜리 월드를 2.6B 모델과 단일 GPU 배포로 끌어내린다

SANA-WM은 Hybrid GDN-Softmax attention, 6-DoF camera control, long-video refiner, pose annotation pipeline을 묶어 720p 60초...

Sangmin Lee2026.05.18

Model Training

SlimQwen은 거대 MoE를 그냥 자르지 않고, 사전학습 궤적까지 함께 압축...

SlimQwen은 Qwen3-Next-80A3B를 23A2B로 줄이는 과정에서 구조적 pruning, partial-preservation expert merging, KD+LM objective, MTP dis...

Sangmin Lee2026.05.18

AI Products & Strategy

MCP Apps는 채팅창을 앱 런타임으로 바꾼다: UI over MCP의 의미

AI Engineer의 MCP UI 발표는 MCP Apps가 tool result를 단순 텍스트가 아니라 sandboxed iframe, ui:// resource, bidirectional communicati...

Sangmin Lee2026.05.16

AI Products & Strategy

Hugging Face Open Agent Ecosystem은 에이전트가 모델을...

Merve Noyan의 AI Engineer 발표는 Hugging Face Hub가 모델 저장소를 넘어, 오픈 모델 탐색·Inference Providers·traces·skills·MCP·Jobs를 묶어 에이전...

Sangmin Lee2026.05.16

Search & Retrieval

Grep이 정말 충분한가: Agentic Search에서 검색보다 하네스가 성능...

arXiv 2605.15184는 LongMemEval 기반 실험으로 agentic search의 성능이 grep 대 vector만이 아니라 하네스, 도구 출력 전달 방식, 노이즈 스케일링의 결합으로 결정된다는 점...

Sangmin Lee2026.05.16

Model Training

SOD는 도구 사용 에이전트 증류를 step 단위로 조절한다

SOD는 tool-integrated reasoning에서 학생 모델의 잘못된 tool call이 만든 상태 드리프트를 step-level divergence로 감지하고, 온폴리시 증류 신호를 단계별로 재가중해...

Sangmin Lee2026.05.16

Model Training

PriorVLA는 로봇 VLA 파인튜닝을 사전지식 보존 문제로 다시 정의한다

PriorVLA는 pretrained VLA를 단순 초기값으로 쓰지 않고, frozen Prior Expert와 Expert Queries로 장면·모터 priors를 보존해 OOD와 few-shot 로봇 조작 적...

Sangmin Lee2026.05.16

Inference Systems

OptiLLM은 추론 시간 최적화를 OpenAI 호환 프록시로 묶는다

OptiLLM은 Best-of-N, MoA, MCTS, CePO, MARS 같은 inference-time 기법을 OpenAI 호환 프록시 뒤에 묶어, 모델 재학습 없이 더 많은 추론 계산으로 정확도와 운영 유연...

Sangmin Lee2026.05.16

Model Training

ELF는 확산 언어 모델을 토큰이 아니라 임베딩 공간의 flow로 다시 만든다

MIT의 ELF는 언어 생성을 연속 임베딩 공간의 Flow Matching 문제로 두고 마지막 단계에서만 토큰으로 이산화해, diffusion/flow 계열의 CFG와 self-conditioning을 언어 모델...

Sangmin Lee2026.05.15