Blog

Knowledge WIKI

335 posts, 266-277 showing

23 / 28

이 워크숍은 로컬 LLM 훈련을 신비화하지 않고 tokenizer·transfo...

Angelos Perivolaropoulos의 'Training an LLM from Scratch, Locally'는 로컬에서 LLM을 훈련한다는 과장된 서사를 걷어내고, 작은 GPT를 tokenizer·arc...

Sangmin Lee2026.05.10

Agent Skills & Workflows

Effect 앱을 바이브 코딩하려면 프롬프트보다 저장소를 같이 넣어야 한다

Michael Arnaldi의 'Vibe Engineering Effect Apps'는 코딩 에이전트가 낯선 라이브러리를 잘 쓰게 만드는 핵심이 더 긴 프롬프트가 아니라 해당 라이브러리의 실제 저장소와 패턴을 작...

Sangmin Lee2026.05.09

Search & Retrieval

PageIndex는 RAG를 벡터 검색이 아니라 문서 구조 위의 추론 문제로 바...

VectifyAI/PageIndex는 긴 문서를 청킹해 벡터 DB에 넣는 전통적 RAG 대신, 계층적 문서 인덱스와 LLM 추론으로 관련 섹션을 좁혀 가는 vectorless retrieval 프레임을 제안한다.

Sangmin Lee2026.05.09

Foundation Models

왜 비전도 결국 Transformer로 수렴했는가

Isaac Robinson의 짧은 발표는 CNN에서 ViT, Swin, ConvNeXt, Hiera, DINOv3, SAM3, RF-DETR로 이어지는 흐름을 따라가며, 비전에서 Transformer가 늦게 이겼...

Sangmin Lee2026.05.09

AI Products & Strategy

WrenAI는 Text-to-SQL 도구가 아니라 AI 에이전트를 위한 open...

Canner/WrenAI는 LLM이 SQL 문법을 쓰게 만드는 도구보다, 비즈니스 의미를 MDL semantic layer로 고정하고 memory·profile·SDK·skills를 붙여 여러 에이전트가 같은 데...

Sangmin Lee2026.05.09

Foundation Models

ZAYA1-8B는 AMD에서 학습한 초소형 활성 reasoning MoE를 te...

Zyphra의 ZAYA1-8B는 약 0.7B 활성·8B급 총 파라미터의 reasoning MoE 위에 CCA, MLP router, learned residual scaling, Markovian RSA를 결합해...

Sangmin Lee2026.05.08

Evaluation & Benchmarks

TabEmbed는 표형 임베딩을 벤치마크와 contrastive matching...

TabEmbed는 TabBench를 통해 표형 임베딩을 classification과 retrieval의 공통 표현 문제로 재정의하고, language-to-row contrastive learning으로 범용 t...

Sangmin Lee2026.05.08

Model Training

UniPool은 MoE expert를 레이어별 자산이 아니라 전역 풀로 바꾼다

UniPool은 MoE에서 레이어마다 따로 들고 있던 expert 집합을 전역 공유 풀로 바꾸고, pool-level balancing과 NormRouter를 더해 깊이에 비례하던 expert 파라미터 증가를 느...

Sangmin Lee2026.05.08

Research Agents

Auto Research는 논문을 쓰지 않고 실험 궤적을 쌓는다

Auto Research는 specialist agent가 코드 수정, 실험 제출, 외부 evaluator 피드백 반영을 반복하는 closed-loop 연구 하네스를 제안한다. 핵심 산출물은 논문 초안이 아니라...

Sangmin Lee2026.05.08

Model Training

LoPE는 왜 의미 없는 문장으로 GRPO의 막힌 탐색을 푸는가

LoPE는 hard question에서 실패한 롤아웃에 Lorem Ipsum 기반 프롬프트 교란을 추가해 GRPO의 zero-advantage 병목을 깨고, prompt-space exploration이 단순 추...

Sangmin Lee2026.05.08

AI Products & Strategy

getdesign.md는 DESIGN.md를 에이전트용 디자인 시스템 마켓플레이...

getdesign.md는 Google Stitch의 DESIGN.md 포맷을 70여 개 브랜드 레퍼런스, 웹 프리뷰, 설치 명령, 저장/북마크 지표, 프라이빗 요청 흐름까지 갖춘 카탈로그로 감싸면서 '디자인 감각...

Sangmin Lee2026.05.07

Agent Skills & Workflows

WOZCODE는 Claude Code를 비용 최적화형 플러그인 런타임으로 감싼다

WithWoz/wozcode-plugin은 Claude Code의 기본 파일 도구를 smart search, batch editing, SQL introspection, subagent delegation으로 대...

Sangmin Lee2026.05.07