Blog

Knowledge WIKI

335 posts, 230-241 showing

20 / 28

MMProLong은 128K VLM 학습을 더 긴 샘플이 아니라 데이터 레시피...

MMProLong은 Qwen2.5-VL-7B를 32K에서 128K로 확장하며, long-document VQA 합성·pool-native 길이 분포·8:2 추출/추론 혼합이 긴 멀티모달 컨텍스트 일반화에 더 중요...

Sangmin Lee2026.05.14

Research Agents

AI co-mathematician은 수학자를 대체하기보다 연구 워크스페이스를...

arXiv 2605.06651은 수학 연구를 단발성 정답 생성이 아니라 장기 상태, 실패 가설, 리뷰된 작업 문서, 인간 조향을 함께 관리하는 agentic workbench 문제로 재정의한다.

Sangmin Lee2026.05.14

Agent Systems

멀티 에이전트의 방관자 효과: 협업이 추론 주권을 무너뜨리는 순간

이 논문은 GAIA·SWE-bench·Multi-Challenge 문맥에서 22,500개 결정론적 궤적을 평가해, 단순한 다수 auditor 프롬프트가 모델의 독립 추론을 사회적 순응으로 바꾸는 Interacti...

Sangmin Lee2026.05.14

Data Infrastructure

Autodata는 합성 데이터 생성을 데이터 과학자 에이전트 루프로 바꾼다

Meta FAIR의 Autodata는 Self-Instruct식 단발 생성이 아니라, 약한 모델과 강한 모델의 성능 격차를 직접 최적화하는 에이전트형 데이터 과학자 루프로 합성 데이터 품질을 끌어올린다.

Sangmin Lee2026.05.14

Agent Systems

Autogenesis는 자가 진화 에이전트를 프로토콜 문제로 다시 정의한다

arXiv 2604.15034는 프롬프트·에이전트·도구·환경·메모리를 버전 관리되는 리소스로 등록하고, 제안·평가·커밋·롤백을 갖춘 AGP/AGS 구조로 자가 진화를 실행 가능한 에이전트 런타임 문제로 옮긴다.

Sangmin Lee2026.05.13

Search & Retrieval

Jina Embeddings v5 Omni는 텍스트 인덱스를 그대로 둔 채 모든...

jina-embeddings-v5-omni는 Jina v5 Text의 벡터 geometry를 보존하면서 이미지·비디오·오디오 타워를 frozen projector로 붙여, 기존 텍스트 인덱스를 멀티모달 검색 su...

Sangmin Lee2026.05.13

Foundation Models

Nemotron 3 Super는 12B 활성 MoE를 Blackwell 추론 스...

NVIDIA Nemotron 3 Super는 120B 총 파라미터·12B 활성 파라미터의 Hybrid Mamba-Attention LatentMoE 모델 위에 NVFP4 pretraining, MTP 기반 nat...

Sangmin Lee2026.05.13

Agent Skills & Workflows

Agent Skills는 코딩 에이전트에 시니어 엔지니어링 절차를 주입한다

addyosmani/agent-skills는 22개 SKILL.md, 7개 slash command, 3개 전문 persona를 묶어 AI 코딩 에이전트가 spec→plan→build→test→review→shi...

Sangmin Lee2026.05.13

Safety & Privacy

ETTIN-68M Nemotron PII는 개인정보 탐지를 68M 토큰 분류기로...

kalyan-ks/ettin-68m-nemotron-pii는 ETTIN 68M encoder와 NVIDIA Nemotron-PII 데이터를 결합해, 영어 PII/PHI 탐지를 작은 NER 모델로 운영 파이프라인에...

Sangmin Lee2026.05.13

Search & Retrieval

OCR-Memory는 에이전트 기억을 텍스트 요약이 아니라 시각적 검색 문제로...

arXiv 2604.26622는 장기 실행 에이전트의 trajectory를 텍스트로 계속 밀어 넣는 대신, multi-resolution 이미지와 Set-of-Mark anchor로 저장하고 필요한 segment...

Sangmin Lee2026.05.13

Agent Systems

OneManCompany는 멀티 에이전트를 ‘회사’라는 운영체제로 재구성한다

OneManCompany(OMC)는 Talent–Container, Talent Market, E²R tree search로 이기종 에이전트를 고용·조정·리뷰하는 조직 레이어를 제안하고, PRDBench 84.6...

Sangmin Lee2026.05.13

Search & Retrieval

Skill-RAG는 RAG 실패를 더 검색할지보다 어떤 실패인지 먼저 진단한다

arXiv 2604.15771의 Skill-RAG는 hidden-state prober로 검색 실패 상태를 감지하고, query rewriting·question decomposition·evidence focu...

Sangmin Lee2026.05.13