Blog

Knowledge WIKI

335 posts, 62-73 showing

6 / 28

Qwable-v1은 Qwen3.6 위에 Claude식 도구 사용을 얹은 코딩 에...

Qwable-v1은 Qwen3.6-35B-A3B 계열 reasoning distill 위에 Claude Fable-5 도구 사용 흔적을 한 번 더 SFT한 35B MoE 오픈 웨이트 모델이다. 공개된 근거는 ag...

Sangmin Lee2026.06.16

Agent Systems

HarnessX는 에이전트 하네스를 조립하고 진화시키는 런타임 foundry다

arXiv 2606.14249는 prompt·tool·memory·control flow를 typed harness primitive로 분리하고, AEGIS trace-driven evolution과 cross-...

Sangmin Lee2026.06.16

Foundation Models

FLARE는 하이브리드 어텐션 AR 모델을 디퓨전 LLM으로 바꾼다

FLARE는 Qwen3.5 계열 하이브리드 어텐션 체크포인트를 약 10B 토큰 전이 학습으로 변환해, 한 체크포인트에서 AR 검증식 디코딩과 디퓨전 병렬 디노이징을 함께 지원하려는 dLLM 변환 프레임워크다.

Sangmin Lee2026.06.16

Inference Systems

SAHI는 작은 객체 탐지를 ‘이미지 전체’가 아니라 ‘겹치는 타일’ 문제로 바...

SAHI는 큰 항공·감시 이미지에서 작은 객체가 입력 리사이즈 과정에서 사라지는 문제를, 겹치는 슬라이스별 추론과 좌표 병합으로 풀어 기존 detector 위에 바로 얹을 수 있는 실용적 small-object...

Sangmin Lee2026.06.16

Inference Systems

ESOD는 고해상도 작은 객체 탐지를 ‘전체 이미지’가 아니라 ‘필요한 패치’...

ESOD는 고해상도 이미지에서 작은 객체가 희소하게 모여 있다는 관찰을 이용해, 특징 맵 수준에서 객체 후보 패치만 남기고 sparse head로 계산량과 메모리 비용을 줄이는 효율적 객체 탐지 프레임워크다.

Sangmin Lee2026.06.16

Agent Systems

Evoflux는 작은 툴 에이전트를 학습보다 실행시간 진화로 고친다

arXiv 2606.12674는 MCP-style 툴 사용을 함수 호출 문제가 아니라 실행 가능한 workflow graph를 고치는 문제로 보고, 작은 planner에서 SFT/DPO보다 inference-ti...

Sangmin Lee2026.06.16

Document Intelligence

PP-OCRv6은 OCR을 거대 VLM 호출이 아니라 전문 파이프라인 문제로 되...

arXiv 2606.13108과 PaddleOCR v3.7.0 릴리스, Hugging Face 배포를 함께 읽어 1.5M~34.5M급 PP-OCRv6이 왜 OCR 전용 모델의 효율과 신뢰성을 다시 전면에 세우는지...

Sangmin Lee2026.06.15

Agent Skills & Workflows

Learn Harness Engineering은 코딩 에이전트를 위한 ‘실행 환...

walkinglabs/learn-harness-engineering은 하네스 엔지니어링을 12개 강의, 6개 실습 프로젝트, 복사 가능한 템플릿과 harness-creator 스킬로 정리한 오픈소스 코스다. 프롬...

Sangmin Lee2026.06.15

Foundation Models

Robust-U1은 MLLM robustness를 이미지 복원 문제로 바꾼다

Robust-U1은 손상된 이미지를 텍스트로 설명하는 대신 MLLM이 직접 복원하고, 복원본과 손상본을 함께 추론에 넣어 real-world corruption robustness를 끌어올린 ICML 2026 논...

Sangmin Lee2026.06.15

Inference Systems

Efficient Reasoning on the Edge는 온디바이스 추론을 L...

Qualcomm AI Research의 Efficient Reasoning on the Edge는 Qwen2.5-7B에 LoRA reasoning adapter, budget forcing, switcher, 병...

Sangmin Lee2026.06.14

Data Infrastructure

Google OKF는 데이터 카탈로그를 에이전트용 Markdown 지식 번들로...

Google Cloud가 공개한 Open Knowledge Format(OKF) v0.1을 데이터 카탈로그, LLM Wiki, 에이전트 컨텍스트 공유 관점에서 정리한다. 핵심은 새 지식 서비스가 아니라 Markd...

Sangmin Lee2026.06.15

Agent Systems

DeepMind의 From AGI to ASI는 AGI 이후를 네 경로와 여섯...

Google DeepMind의 arXiv 2606.12683v1은 AGI를 종착점이 아니라 post-AGI 전환의 출발점으로 놓고, ASI로 가는 네 가지 기술 경로와 여섯 가지 병목을 연구 질문으로 정리한다.

Sangmin Lee2026.06.14