Blog

Knowledge WIKI

335 posts, 26-37 showing

3 / 28

MrFlow는 이미지 생성 추론을 저해상도 구조 생성과 1-step 보정으로 가...

MrFlow는 flow-matching 이미지 생성 모델에서 저해상도 샘플링, 픽셀 공간 업스케일, 약한 노이즈 주입, 고해상도 1-step refinement를 묶어 학습 없이 8–10× 추론 가속을 노리는 s...

Sangmin Lee2026.07.04

Inference Systems

DeepSpec은 speculative decoding을 초안 모델 학습 파이프...

DeepSeek의 DeepSpec은 DSpark·DFlash·Eagle3 초안 모델을 데이터 준비, 학습, 평가까지 묶어 공개하며, 추측 디코딩을 단순 런타임 옵션이 아니라 재학습 가능한 서빙 스택으로 보여준다.

Sangmin Lee2026.07.04

Video Generation

WorldDirector는 비디오 월드 모델에 ‘보이지 않는 물체의 기억’을 분...

WorldDirector는 LLM이 3D 객체·카메라 궤적을 계획하고, 이를 2D 위치 조건·appearance binding·causal chunk memory로 내려보내 장기 비디오에서 동적 객체 영속성을 유...

Sangmin Lee2026.07.04

Inference Systems

ELDR는 MoE 디코딩 라우팅을 expert locality 문제로 바꾼다

ELDR는 PD-disaggregated MoE 서빙에서 prefill expert signature를 이용해 decode worker를 고르고, active expert union을 줄여 TPOT를 낮추는 vL...

Sangmin Lee2026.07.03

Foundation Models

AMVL은 멀티모달 추론을 텍스트 CoT가 아니라 연속 latent로 보게 한다

AMVL은 목표 답을 보는 posterior와 추론 때 쓰는 prior 사이의 answer leakage를 forward/reverse KL로 보정해, Qwen2.5-VL-7B 기반 멀티모달 추론에서 BLINK...

Sangmin Lee2026.07.03

Model Training

CausalMix는 SFT 데이터 믹스를 인과추론 문제로 다시 읽는다

CausalMix는 512개 Qwen2.5-0.5B proxy run에서 데이터 상태, 도메인 비율, downstream 점수를 분리해 SFT 데이터 믹스를 상태별 causal marginal return으로 추...

Sangmin Lee2026.07.03

Model Training

Dockerless는 테스트 실행 없이 코딩 에이전트 패치를 검증하려 한다

arXiv 2606.28436의 Dockerless는 Docker 이미지와 테스트 실행 없이 issue·reference patch·candidate patch를 바탕으로 저장소를 읽기 전용 탐색해 패치 정합성을...

Sangmin Lee2026.07.02

Foundation Models

Orca는 다음 토큰이 아니라 다음 ‘세계 상태’를 예측하려 한다

BAAI의 Orca는 Next-State Prediction을 중심에 놓고 세계 잠재공간을 학습한 뒤, frozen backbone 위의 텍스트·이미지·행동 readout으로 그 표현이 실제로 쓸모 있는지 검증한...

Sangmin Lee2026.07.02

Agent Skills & Workflows

Neural Procedural Memory는 에이전트 메모리를 activati...

Neural Procedural Memory는 과거 trajectory의 성공/실패 대비를 steering vector로 압축해, LLM agent의 절차 기억을 텍스트 지시문이 아니라 residual strea...

Sangmin Lee2026.07.02

Evaluation & Benchmarks

Agentic Abstention은 에이전트에게 ‘언제 멈출지’를 묻는다

Agentic Abstention은 WebShop·Terminal-Bench·AbstentionBench를 28K+ 순차 의사결정 과제로 엮어, LLM 에이전트가 불가능한 요청 앞에서 제때 멈추는지 측정한다.

Sangmin Lee2026.07.01

Model Training

Agents-A1은 파라미터보다 에이전트의 horizon을 스케일링한다

Agents-A1은 Qwen3.5-35B-A3B 기반 35B MoE를 45K 토큰 장기 trajectory, knowledge-action graph, domain-routed on-policy distillat...

Sangmin Lee2026.06.30

Evaluation & Benchmarks

Video-MME-Logical은 비디오 모델의 시간-논리 추론을 분해해서 본다

Video-MME-Logical은 25개 절차 생성 과제와 중간 상태 진단으로 MLLM이 프레임을 보는 것을 넘어 시간에 따라 상태를 유지·갱신·조합하는지 평가한다.

Sangmin Lee2026.06.30