Blog

Knowledge WIKI

335 posts, 158-169 showing

14 / 28

6가지 Agentic Design Pattern은 에이전트를 제품 구조로 보는...

Akshay Pachaar의 LinkedIn 포스트와 Daily Dose of Data Science 인포그래픽을 출발점으로 ReAct, CodeAct, MCP 기반 tool use, self-reflection...

Sangmin Lee2026.05.26

Agent Systems

Fara-7B는 컴퓨터 사용 에이전트를 온디바이스 7B 문제로 바꾼다

Microsoft Research의 Fara-7B는 스크린샷만 보고 좌표 행동을 예측하는 7B 컴퓨터 사용 에이전트로, FaraGen 합성 궤적과 Critical Point 안전장치를 통해 웹 자동화의 비용·프라...

Sangmin Lee2026.05.26

Inference Systems

Unsloth는 QAT와 ExecuTorch로 Qwen3를 스마트폰 안으로 밀어...

Unsloth의 phone deployment 가이드는 Qwen3-0.6B를 QAT로 파인튜닝하고 TorchAO/ExecuTorch로 .pte 모델을 내보낸 뒤, Pixel 8과 iPhone 계열 기기에서 로컬...

Sangmin Lee2026.05.25

Foundation Models

LFM2는 파운데이션 모델을 엣지 지연·메모리 문제로 다시 설계한다

LFM2 Technical Report는 게이트드 짧은 합성곱과 소수의 GQA 블록을 결합한 하이브리드 백본, 32K 컨텍스트, VL·Audio·ColBERT 변형, 엣지 런타임 패키징을 한 묶음으로 공개한 Li...

Sangmin Lee2026.05.25

Search & Retrieval

HNSW는 벡터 검색을 고차원 skip list로 만든다

Victoria Slocum의 HNSW 설명 포스트를 출발점으로, 벡터 DB가 brute-force 검색 대신 계층적 근접 그래프를 쓰는 이유와 M·ef·distance 튜닝의 실무적 의미를 정리한다.

Sangmin Lee2026.05.25

Search & Retrieval

ctxl-rerank-v2 seq-cls는 CausalLM reranker를 표...

sigridjineth/ctxl-rerank-v2-1b-seq-cls는 Contextual AI Reranker v2 1B의 마지막 토큰 vocab_id=0 logit을 단일 SequenceClassificati...

Sangmin Lee2026.05.25

Document Intelligence

DeepSeek-OCR 시각화는 OCR 모델을 압축 아키텍처로 읽게 만든다

Frederik vom Lehn의 DeepSeek-OCR fully visualised와 DeepSeek 공식 논문·GitHub·Hugging Face 자료를 함께 읽어, Gundam 모드, SAM/CNN/CLI...

Sangmin Lee2026.05.25

Model Training

MobileLLM-R1은 서브-B reasoning model의 학습 레시피를...

arXiv 2509.24945의 MobileLLM-R1은 140M·360M·950M reasoning model을 공개하면서, 초대형 말뭉치보다 능력별 데이터 선별·재혼합·지식 압축이 작은 모델의 reasonin...

Sangmin Lee2026.05.25

Document Intelligence

Mistral OCR 3는 OCR을 문서 지식화 엔진으로 바꾼다

Mistral OCR 3는 OCR을 단순 텍스트 인식이 아니라 Markdown, HTML table, structured annotation, Document AI Playground까지 이어지는 문서 구조 복원...

Sangmin Lee2026.05.25

Foundation Models

TabPFN은 작은 표형 데이터에서 학습 알고리즘 자체를 foundation m...

Nature 논문으로 정식화된 TabPFN은 1억 개 안팎의 synthetic tabular task로 transformer를 사전학습해, 작은 표형 데이터셋에서 학습·튜닝 루프를 한 번의 in-context p...

Sangmin Lee2026.05.25

Model Training

Forward-Forward는 역전파를 두 번의 순전파로 바꿀 수 있을까

Geoffrey Hinton의 Forward-Forward 알고리즘은 각 layer가 positive data와 negative data를 구분하는 local goodness objective로 학습하면, 역전파...

Sangmin Lee2026.05.25

Evaluation & Benchmarks

Pare-Bench는 proactive assistant 평가를 능동 사용자 시...

Pare는 FSM 기반 모바일 앱과 active user simulator로 proactive assistant의 goal inference, intervention timing, multi-app orchest...

Sangmin Lee2026.05.25