Tag

#Agent Systems

Agent Systems

Qwen-AgentWorld는 에이전트의 ‘환경’을 예측하는 언어 월드 모델이다

Qwen-AgentWorld는 MCP, 검색, 터미널, SWE, 웹, OS, Android까지 7개 에이전트 환경의 다음 관찰을 예측하도록 학습한 언어 월드 모델과 AgentWorldBench 공개 패키지다.

Sangmin Lee2026.06.25

Agent Skills & Workflows

OpenClaw-Skill은 에이전트 스킬을 목록이 아니라 트리로 찾는다

arXiv 2606.16774는 여러 모델의 실행 궤적과 judge 평가를 결합해 전이 가능한 스킬 트리를 만들고, CSRL로 스킬 조건부 rollout을 비교 학습하는 OpenClaw-Skill을 제안한다.

Sangmin Lee2026.06.18

Agent Systems

HarnessX는 에이전트 하네스를 조립하고 진화시키는 런타임 foundry다

arXiv 2606.14249는 prompt·tool·memory·control flow를 typed harness primitive로 분리하고, AEGIS trace-driven evolution과 cross-...

Sangmin Lee2026.06.16

Agent Systems

Evoflux는 작은 툴 에이전트를 학습보다 실행시간 진화로 고친다

arXiv 2606.12674는 MCP-style 툴 사용을 함수 호출 문제가 아니라 실행 가능한 workflow graph를 고치는 문제로 보고, 작은 planner에서 SFT/DPO보다 inference-ti...

Sangmin Lee2026.06.16

Agent Systems

TIDE는 에이전트의 proactivity를 ‘하나의 추천’이 아니라 숨은 문제...

TIDE 논문은 proactive agent가 사용자의 명시 요청을 기다리는 대신, 개인 workspace와 software repository 안에 공존하는 여러 숨은 문제를 반복적으로 찾고 근거와 해결 행동까...

Sangmin Lee2026.06.06

Agent Skills & Workflows

Hermes Agent Self-Evolution은 에이전트 스킬을 자동으로 진...

NousResearch의 별도 저장소는 DSPy+GEPA로 Hermes Agent의 SKILL.md, 도구 설명, 시스템 프롬프트를 평가 가능한 변종으로 만들고, 작은 Phase 1 검증을 통해 자동 스킬 개선...

Sangmin Lee2026.06.04

Agent Systems

Enactive AI는 에이전트를 ‘세계와 맞물려 배우는 시스템’으로 다시 묻는...

Rafiee와 Sutton의 arXiv 2605.24238은 경험, 행동-지각 불가분성, 자율성, 체화라는 네 개념으로 LLM과 RL 이후의 에이전트 설계를 재해석한다.

Sangmin Lee2026.05.29

Research Agents

AutoResearchClaw는 자동 연구를 실패에서 배우는 에이전트 루프로 바...

arXiv 2605.20025는 AutoResearchClaw를 multi-agent debate, self-healing execution, verified result registry, HITL co-pilo...

Sangmin Lee2026.05.20

Agent Systems

Anthropic의 effective agent 원칙은 ‘더 자율적인 모델’보다...

Barry Zhang의 AI Engineer 발표는 Anthropic의 Building Effective Agents 글을 바탕으로, 에이전트를 모든 문제에 붙이는 대신 복잡도·가치·검증 가능성·오류 비용을 따지...

Sangmin Lee2026.05.19

AI Products & Strategy

Hugging Face Open Agent Ecosystem은 에이전트가 모델을...

Merve Noyan의 AI Engineer 발표는 Hugging Face Hub가 모델 저장소를 넘어, 오픈 모델 탐색·Inference Providers·traces·skills·MCP·Jobs를 묶어 에이전...

Sangmin Lee2026.05.16

Inference Systems

OptiLLM은 추론 시간 최적화를 OpenAI 호환 프록시로 묶는다

OptiLLM은 Best-of-N, MoA, MCTS, CePO, MARS 같은 inference-time 기법을 OpenAI 호환 프록시 뒤에 묶어, 모델 재학습 없이 더 많은 추론 계산으로 정확도와 운영 유연...

Sangmin Lee2026.05.16

Agent Systems

Reinforced Agent는 툴 호출을 실행 전에 한 번 더 검토하는 실용적...

Reinforced Agent 논문은 툴 호출 에이전트의 오류를 사후 복구가 아니라 실행 전 리뷰 문제로 바꾸고, Helpfulness-Harmfulness 지표로 reviewer agent가 실제로 도움이 되는...

Sangmin Lee2026.05.13