Blog

Knowledge WIKI

335 posts, 194-205 showing

17 / 28

Google I/O 2026은 Gemini를 에이전트 시대의 풀스택 플랫폼으로...

Google I/O 2026의 Sundar Pichai 키노트는 Gemini 3.5, Antigravity, Spark, Search agents, TPU 8을 하나의 agentic Gemini stack으로 묶...

Sangmin Lee2026.05.21

Foundation Models

Qwen3.7-Max는 에이전트 시대의 파운데이션 모델을 정면으로 겨냥한다

Qwen3.7-Max는 코딩 에이전트, MCP 기반 업무 자동화, 장시간 자율 실행, cross-harness 일반화를 전면에 내세운 Qwen의 최신 독점형 agent foundation model이다.

Sangmin Lee2026.05.21

Document Intelligence

NuExtract3는 문서 추출을 JSON과 OCR로 나누지 않는다

NuExtract3는 구조화 추출과 문서-to-Markdown OCR을 하나의 4B VLM으로 묶고, reasoning을 필요할 때만 켜는 방식으로 문서 AI 파이프라인의 비용·품질 균형점을 다시 설계한다.

Sangmin Lee2026.05.20

AI Products & Strategy

Apple Intelligence 접근성 업데이트는 AI를 운영체제의 보조 레이...

Apple의 2026년 접근성 업데이트는 생성형 AI를 별도 챗봇이 아니라 VoiceOver, Magnifier, Voice Control, Accessibility Reader, 자막, Vision Pro 입력...

Sangmin Lee2026.05.20

Research Agents

AutoResearchClaw는 자동 연구를 실패에서 배우는 에이전트 루프로 바...

arXiv 2605.20025는 AutoResearchClaw를 multi-agent debate, self-healing execution, verified result registry, HITL co-pilo...

Sangmin Lee2026.05.20

Evaluation & Benchmarks

HarnessAudit는 에이전트 하네스 안전성을 실행 궤적으로 감사한다

HarnessAudit는 최종 답변이 아니라 tool, resource, information-flow가 지나간 전체 trajectory를 감사해 에이전트 하네스의 안전 경계를 평가하는 benchmark와 실행...

Sangmin Lee2026.05.20

Agent Skills & Workflows

MMSkills는 시각 에이전트 스킬을 멀티모달 절차 기억으로 만든다

MMSkills는 SKILL.md 절차에 상태 카드와 시각 keyframe을 결합하고, 런타임에는 branch loading으로 필요한 증거만 검토하게 만드는 시각 에이전트용 멀티모달 스킬 프레임워크다.

Sangmin Lee2026.05.20

Agent Skills & Workflows

SkillsVote는 에이전트 스킬을 추천에서 진화까지 거버넌스한다

SkillsVote는 100만 규모의 SKILL.md 생태계에서 어떤 스킬을 노출하고, 실행 결과를 어떻게 귀속하며, 어떤 경험만 라이브러리에 반영할지를 하나의 수명주기 문제로 다루는 에이전트 스킬 거버넌스 프레...

Sangmin Lee2026.05.20

Video Generation

LongLive-2.0은 긴 비디오 생성을 NVFP4 학습·추론 시스템 문제로...

NVIDIA LongLive-2.0은 Balanced SP, NVFP4 학습·추론, KV-cache 양자화, asynchronous VAE decoding을 묶어 긴 비디오 생성의 학습 비용과 실시간 추론 병목을...

Sangmin Lee2026.05.20

Foundation Models

Lance는 멀티태스크 시너지로 이미지·비디오 이해와 생성을 한 모델에 묶는다

ByteDance의 Lance는 3B active parameter급 native unified multimodal model로, 이미지·비디오 이해, 생성, 편집을 shared interleaved contex...

Sangmin Lee2026.05.20

Research Agents

AI for Auto-Research는 자동 연구를 라이프사이클 거버넌스로 바꾼...

arXiv 2605.18661은 AI 자동연구를 네 단계·여덟 스테이지의 전체 연구 라이프사이클로 정리하고, 완전 자율보다 인간이 통제하는 검증·출처·책임 설계가 더 중요한 병목이라고 주장한다.

Sangmin Lee2026.05.20

Model Training

MinT는 LoRA를 학습 기법이 아니라 정책 운영 단위로 만든다

Mind Lab의 MinT 기술 보고서는 LoRA adapter를 단순 메모리 절약용 파라미터가 아니라 rollout, update, export, evaluation, serving, rollback을 통과하는...

Sangmin Lee2026.05.20