Blog

Knowledge WIKI

335 posts, 146-157 showing

13 / 28

VLA 초기화는 VLM 표현을 얼마나 보존할지의 문제다

Rethinking VLM Representation for VLA Initialization은 로봇 VLA 성능을 단순한 백본 크기 문제가 아니라 embodied VQA 신호, LoRA 보존, 로봇 데이터 사전...

Sangmin Lee2026.05.28

Evaluation & Benchmarks

Claw-Anything는 개인 비서 평가를 ‘항상 켜진 디지털 세계’ 문제로...

Claw-Anything는 수개월치 사용자 활동, 여러 백엔드 서비스, CLI·GUI 기기를 함께 열어 둔 상태에서 always-on 개인 비서가 언제 무엇을 봐야 하고 어디까지 행동해야 하는지를 측정하려는 벤치...

Sangmin Lee2026.05.28

Inference Systems

MobileMoE는 MoE를 스마트폰 지연·메모리 문제로 다시 설계한다

MobileMoE는 0.3–0.9B 활성 파라미터의 MoE를 온디바이스 메모리·연산 제약에 맞춰 설계하고, INT4 QAT와 ExecuTorch 커스텀 커널로 실제 스마트폰에서 dense MobileLLM-Pro...

Sangmin Lee2026.05.27

Agent Skills & Workflows

Harness는 Claude Code 에이전트 팀을 찍어내는 메타 스킬이다

revfactory/harness는 도메인 한 문장을 Claude Code용 에이전트 팀, 역할 정의, 스킬 세트로 변환하는 팀 아키텍처 팩토리이며, Agent Teams의 실험적 협업 모델을 재사용 가능한 하네...

Sangmin Lee2026.05.27

Research Agents

Autoresearch는 코딩 에이전트를 지표 기반 개선 루프로 바꾼다

uditgoenka/autoresearch는 Karpathy의 autoresearch를 Claude Code, OpenCode, Codex용 skill/command 패키지로 확장해 Goal·Scope·Metri...

Sangmin Lee2026.05.27

Foundation Models

RF-DETR는 비전 Transformer를 실시간 객체검출기로 다시 조립한다

RF-DETR 논문은 DINOv2 기반 DETR에 weight-sharing NAS를 결합해 COCO와 RF100-VL에서 실시간 detection·segmentation의 accuracy-latency Pare...

Sangmin Lee2026.05.26

Agent Skills & Workflows

SkillOpt는 에이전트 스킬을 가중치 없이 학습 가능한 절차로 바꾼다

Microsoft 등이 공개한 SkillOpt는 에이전트의 자연어 skill 문서를 모델 가중치가 아닌 외부 학습 상태로 보고, rollout·reflection·bounded edit·validation gat...

Sangmin Lee2026.05.26

Inference Systems

DeepConf는 확신도로 LLM 병렬 추론의 낭비를 줄인다

DeepConf는 self-consistency식 병렬 추론에서 모든 reasoning trace를 같은 한 표로 취급하지 않고, 모델 내부 confidence 신호로 낮은 품질의 추론을 필터링하거나 조기 중단해...

Sangmin Lee2026.05.26

Foundation Models

ERNIE-4.5-VL-Thinking은 3B 활성 MoE로 멀티모달 추론을 가...

Baidu의 ERNIE-4.5-VL-28B-A3B-Thinking은 28B급 총 파라미터와 3B 활성 파라미터를 갖는 공개 VLM으로, 이미지·비디오 reasoning, grounding, tool call, 1...

Sangmin Lee2026.05.26

Safety & Privacy

Kanana Safeguard 8B는 한국어 AI 서비스를 위한 공개 가드레일...

카카오의 Kanana Safeguard 8B는 한국어 유해 콘텐츠 탐지를 단일 토큰 분류 문제로 만들고, 사용자 발화와 AI 응답을 함께 판정하도록 공개된 Apache-2.0 가드레일 모델이다.

Sangmin Lee2026.05.26

Search & Retrieval

RAG 청킹 최적화는 검색 단위를 설계하는 일이다

요즘IT의 PyCon Korea 2025 세션 정리를 출발점으로, RAG 청킹을 고정 토큰 수 튜닝이 아니라 문맥 보존·메타데이터·검색 비용을 함께 다루는 데이터 인프라 설계 문제로 정리한다.

Sangmin Lee2026.05.26

Search & Retrieval

FastEmbed-rs는 RAG 임베딩·리랭킹을 Rust 로컬 런타임으로 묶는다

fastembed-rs는 ONNX Runtime, Hugging Face tokenizers, 선택적 Candle 백엔드를 묶어 텍스트·희소·이미지 임베딩과 reranking을 Rust 애플리케이션 안에서 실행하...

Sangmin Lee2026.05.26