Agent Skills & Workflows

autoresearch-skill은 스킬 프롬프트를 keep-or-discard...

olelehmann1337/autoresearch-skill은 Claude Code skill을 여러 번 실행하고 binary eval로 점수화한 뒤, 한 번에 하나의 prompt mutation만 keep-or...

Sangmin Lee2026.07.15

Agent Skills & Workflows

SkillOpt-Lite는 에이전트 자기진화를 파일 디버깅 루프로 되돌린다

arXiv 2607.03451은 에이전트 스킬 최적화를 복잡한 tree merge와 update damping이 아니라, 실패 trace 파일을 읽고 최소 패치를 만든 뒤 독립 validation gate로 ke...

Sangmin Lee2026.07.09

Agent Skills & Workflows

SkillComposer는 에이전트 스킬 선택을 검색이 아니라 순서 있는 생성...

arXiv 2606.32025는 LLM 에이전트가 어떤 스킬을 몇 개, 어떤 순서로 불러올지를 하나의 시퀀스 생성 문제로 정식화하고, 3.9M 학습 파라미터의 작은 컴포저가 검색·전체 SFT 방식보다 안정적인 스...

Sangmin Lee2026.07.07

Agent Skills & Workflows

HASTE는 에이전트 스킬을 계층으로 쌓아 ML 엔지니어링 반복을 줄인다

arXiv 2606.30911은 ML 엔지니어링 에이전트가 과거 Kaggle 경험을 global·domain·competition 스킬로 나눠 재사용할 때, 단순한 flat memory보다 전이 효율이 좋아진다는...

Sangmin Lee2026.07.06

Agent Skills & Workflows

Neural Procedural Memory는 에이전트 메모리를 activati...

Neural Procedural Memory는 과거 trajectory의 성공/실패 대비를 steering vector로 압축해, LLM agent의 절차 기억을 텍스트 지시문이 아니라 residual strea...

Sangmin Lee2026.07.02

Agent Skills & Workflows

OpenClaw-Skill은 에이전트 스킬을 목록이 아니라 트리로 찾는다

arXiv 2606.16774는 여러 모델의 실행 궤적과 judge 평가를 결합해 전이 가능한 스킬 트리를 만들고, CSRL로 스킬 조건부 rollout을 비교 학습하는 OpenClaw-Skill을 제안한다.

Sangmin Lee2026.06.18

Agent Skills & Workflows

Learn Harness Engineering은 코딩 에이전트를 위한 ‘실행 환...

walkinglabs/learn-harness-engineering은 하네스 엔지니어링을 12개 강의, 6개 실습 프로젝트, 복사 가능한 템플릿과 harness-creator 스킬로 정리한 오픈소스 코스다. 프롬...

Sangmin Lee2026.06.15

Agent Skills & Workflows

SkillSpector는 에이전트 스킬 설치 전 보안 검사를 표준화한다

NVIDIA SkillSpector는 SKILL.md와 에이전트 스킬 번들을 설치하기 전에 정적 분석, 선택적 LLM 의미 분석, OSV 취약점 조회, SARIF 리포트를 결합해 신뢰 경계를 점검하는 Python...

Sangmin Lee2026.06.14

Agent Skills & Workflows

Self-Harness는 에이전트가 자기 하네스를 직접 고치는 실험이다

arXiv 2606.09498은 고정된 LLM 에이전트가 자신의 실행 trace에서 반복 실패를 채굴하고, bounded harness edit을 제안한 뒤, held-in/held-out regression g...

Sangmin Lee2026.06.10

Agent Skills & Workflows

LazyCodex는 Codex에 OmO 하네스를 얹는 LazyVim식 배포 레이...

LazyCodex는 npx 한 줄로 OmO의 planning, skills, hooks, model routing, verified completion을 Codex에 설치하는 얇은 배포층이다. 다만 GitHub...

Sangmin Lee2026.06.08

Agent Skills & Workflows

Ouroboros는 코딩 에이전트를 명세·검증·런타임 교체 가능한 Agent O...

Q00/ouroboros는 막연한 아이디어를 바로 코드로 보내지 않고, 소크라테스식 인터뷰·불변 Seed·3단계 평가·런타임 어댑터를 통해 AI 코딩 작업을 replayable한 실행 계약으로 바꾸려는 speci...

Sangmin Lee2026.06.08

Agent Skills & Workflows

Local Harness는 개인 에이전트의 스킬 선택을 메모리 프롬프트에서 분리...

arXiv 2606.05828은 개인 에이전트의 스킬 선택을 LLM의 메모리 프롬프트에 맡기는 대신, 로컬 통계 priors와 좁은 LLM override probe로 분리하는 Local Harness를 제안한다...

Sangmin Lee2026.06.07

Agent Skills & Workflows

Subterranean Agent는 에이전트 워크플로를 가중치에 컴파일한다

arXiv 2605.22502는 외부 오케스트레이터가 매 턴 절차를 주입하는 대신, 절차형 agent workflow를 작은 fine-tuned model의 가중치에 내재화하면 near-frontier 품질을 훨...

Sangmin Lee2026.06.05

Agent Skills & Workflows

COLLEAGUE.SKILL은 사람의 흔적을 에이전트 스킬 패키지로 바꾼다

COLLEAGUE.SKILL은 동료의 리뷰 기준, 공적 인물의 사고 모델, 민감한 관계 기록을 불투명한 persona prompt가 아니라 inspectable·correctable·governable SKILL...

Sangmin Lee2026.06.04

Agent Skills & Workflows

Hermes Agent Self-Evolution은 에이전트 스킬을 자동으로 진...

NousResearch의 별도 저장소는 DSPy+GEPA로 Hermes Agent의 SKILL.md, 도구 설명, 시스템 프롬프트를 평가 가능한 변종으로 만들고, 작은 Phase 1 검증을 통해 자동 스킬 개선...

Sangmin Lee2026.06.04

Agent Skills & Workflows

Harness Updating은 Harness Benefit이 아니다

arXiv 2605.30621은 자기진화 에이전트의 성능 향상을 업데이트 작성 능력과 업데이트 활용 능력으로 분해하고, 실제 병목이 evolver보다 task-solving agent 쪽에 있음을 보여준다.

Sangmin Lee2026.06.04

Agent Skills & Workflows

Google DeepMind Science Skills는 과학 에이전트를 워크플...

Google DeepMind의 Science Skills는 Antigravity 위에서 생명과학 데이터베이스, 스크립트, 도메인별 절차를 SKILL.md 단위로 묶어 과학 워크플로의 신뢰도와 토큰 효율을 높이려는...

Sangmin Lee2026.06.02

Agent Skills & Workflows

Harness는 Claude Code 에이전트 팀을 찍어내는 메타 스킬이다

revfactory/harness는 도메인 한 문장을 Claude Code용 에이전트 팀, 역할 정의, 스킬 세트로 변환하는 팀 아키텍처 팩토리이며, Agent Teams의 실험적 협업 모델을 재사용 가능한 하네...

Sangmin Lee2026.05.27

Agent Skills & Workflows

SkillOpt는 에이전트 스킬을 가중치 없이 학습 가능한 절차로 바꾼다

Microsoft 등이 공개한 SkillOpt는 에이전트의 자연어 skill 문서를 모델 가중치가 아닌 외부 학습 상태로 보고, rollout·reflection·bounded edit·validation gat...

Sangmin Lee2026.05.26

Agent Skills & Workflows

SmallCode는 작은 로컬 모델의 약점을 하네스 설계로 보정하려는 코딩 에이...

SmallCode는 7B~20B 로컬 모델을 전제로 context budget, forgiving tool parser, patch-first editing, 검증 루프를 묶은 코딩 에이전트다. v0.7.1 릴리...

Sangmin Lee2026.05.21

Agent Skills & Workflows

MMSkills는 시각 에이전트 스킬을 멀티모달 절차 기억으로 만든다

MMSkills는 SKILL.md 절차에 상태 카드와 시각 keyframe을 결합하고, 런타임에는 branch loading으로 필요한 증거만 검토하게 만드는 시각 에이전트용 멀티모달 스킬 프레임워크다.

Sangmin Lee2026.05.20

Agent Skills & Workflows

SkillsVote는 에이전트 스킬을 추천에서 진화까지 거버넌스한다

SkillsVote는 100만 규모의 SKILL.md 생태계에서 어떤 스킬을 노출하고, 실행 결과를 어떻게 귀속하며, 어떤 경험만 라이브러리에 반영할지를 하나의 수명주기 문제로 다루는 에이전트 스킬 거버넌스 프레...

Sangmin Lee2026.05.20

Agent Skills & Workflows

AI Harness는 프롬프트를 더 세게 쓰는 대신 실행 환경을 설계하는 일이다

Tejas Kumar의 AI Engineer 발표는 낡은 GPT-3.5 Turbo 브라우저 에이전트가 Hacker News upvote task에서 실패하고 거짓 성공을 보고하는 장면을 출발점으로, tool re...

Sangmin Lee2026.05.19

Agent Skills & Workflows

No Vibes Allowed는 AI 코딩의 병목을 모델이 아니라 컨텍스트 공급...

Dex Horthy의 AI Engineer 발표는 복잡한 brownfield 코드베이스에서 AI 코딩 에이전트가 실패하는 이유를 모델 지능 부족보다 context window 관리, compaction, spec...

Sangmin Lee2026.05.19

Agent Skills & Workflows

Anthropic의 Agent Skills는 에이전트를 더 만들기보다 전문성 폴...

Barry Zhang과 Mahesh Murag의 AI Engineer 발표는 Claude Code와 MCP 이후의 에이전트 병목이 연결성이 아니라 도메인 전문성이라고 보고, SKILL.md·스크립트·참조 파일을...

Sangmin Lee2026.05.19

Agent Skills & Workflows

Agent Skills는 코딩 에이전트에 시니어 엔지니어링 절차를 주입한다

addyosmani/agent-skills는 22개 SKILL.md, 7개 slash command, 3개 전문 persona를 묶어 AI 코딩 에이전트가 spec→plan→build→test→review→shi...

Sangmin Lee2026.05.13

Agent Skills & Workflows

SRA는 에이전트 스킬을 프롬프트 목록에서 검색 가능한 능력 코퍼스로 바꾼다

arXiv 2604.24594는 Skill Retrieval Augmentation과 SRA-Bench를 통해 에이전트 스킬 검색·로딩·적용을 분리 평가하고, 병목이 검색 품질만이 아니라 모델의 스킬 로딩 판단에...

Sangmin Lee2026.05.11

Agent Skills & Workflows

Harness Engineering은 코딩 에이전트 시대의 소프트웨어 공학을 ‘...

OpenAI Ryan Lopopolo의 AI Engineer Europe 발표는 코드 작성이 싸진 뒤의 병목이 인간의 주의, 모델 컨텍스트, 검증 루프가 되며, 엔지니어의 역할이 에이전트가 일하기 좋은 하네스를...

Sangmin Lee2026.05.11

Agent Skills & Workflows

Context Mode는 AI 코딩 에이전트의 컨텍스트 병목을 운영체제처럼 다룬...

mksglu/context-mode는 MCP 도구 출력, 세션 압축, 상태 복구, 검색 기반 재주입을 하나의 실행 레이어로 묶어 Claude Code·Gemini CLI·Cursor·Copilot·OpenCode...

Sangmin Lee2026.05.11

Agent Skills & Workflows

Matt Pocock의 AI 코딩 워크플로는 ‘프롬프트 비법’이 아니라 소프트웨...

AI Engineer의 Matt Pocock 워크숍은 AI 코딩의 핵심을 더 긴 프롬프트가 아니라 작은 작업, 공유된 설계 개념, PRD, Kanban, TDD, deep module, 병렬 에이전트 운영으로 재...

Sangmin Lee2026.05.10

Agent Skills & Workflows

Future Slide Skill은 슬라이드 생성을 4단계 파이프라인으로 묶는다

bytonylee/future-slide-skill은 참조 슬라이드에서 DESIGN.md를 추출하고, 덱 계획과 페이지별 프롬프트, 순차 이미지 생성을 분리해 GPT 계열 모델의 흔한 슬라이드 생성 실패를 줄이려...

Sangmin Lee2026.05.10

Agent Skills & Workflows

Skills at Scale은 프롬프트를 팀용 운영 자산으로 바꾼다

Nick Nisi와 Zack Proser의 'Skills at Scale'은 코딩 에이전트 활용의 핵심을 더 긴 프롬프트가 아니라, 설명·제약·스크립트·평가 루프를 갖춘 portable skill로 업무 지식을...

Sangmin Lee2026.05.10

Agent Skills & Workflows

Effect 앱을 바이브 코딩하려면 프롬프트보다 저장소를 같이 넣어야 한다

Michael Arnaldi의 'Vibe Engineering Effect Apps'는 코딩 에이전트가 낯선 라이브러리를 잘 쓰게 만드는 핵심이 더 긴 프롬프트가 아니라 해당 라이브러리의 실제 저장소와 패턴을 작...

Sangmin Lee2026.05.09

Agent Skills & Workflows

WOZCODE는 Claude Code를 비용 최적화형 플러그인 런타임으로 감싼다

WithWoz/wozcode-plugin은 Claude Code의 기본 파일 도구를 smart search, batch editing, SQL introspection, subagent delegation으로 대...

Sangmin Lee2026.05.07

Agent Skills & Workflows

Skills-Coach는 스킬 마켓을 평가 가능한 최적화 루프로 바꾸려 한다

Skills-Coach는 LLM 에이전트 스킬을 자동으로 테스트하고, Training-Free GRPO로 문서와 코드를 다듬고, 원본과 최적화본을 비교 평가하는 self-evolving optimizer 프레임워...

Sangmin Lee2026.05.07

Agent Skills & Workflows

SSL은 에이전트 스킬을 문서에서 구조로 끌어낸다

Peking University의 SSL 논문은 SKILL.md 중심의 텍스트 스킬을 스케줄링·구조·논리 3계층 표현으로 정규화해, 스킬 검색과 사전 위험 검토를 더 기계 친화적으로 만들 수 있음을 보여준다.

Sangmin Lee2026.05.07

Agent Skills & Workflows

Ctx2Skill은 긴 문맥을 읽는 능력을 파라미터가 아니라 스킬 문서로 끌어올...

Ctx2Skill은 복잡한 문맥에서 규칙과 절차를 자연어 스킬로 추출해 언어모델의 context learning을 강화하는 self-play 프레임워크로, 인간 주석과 외부 실행 피드백 없이도 closed-sou...

Sangmin Lee2026.05.06

Agent Skills & Workflows

Understand Anything은 코드베이스 이해를 인터랙티브 지식 그래프로...

Lum1104/Understand-Anything은 코드·문서·Karpathy 스타일 위키를 멀티 에이전트 파이프라인으로 분석해 구조 그래프, 도메인 그래프, 검색, 온보딩, diff 영향 분석까지 연결하는 오픈...

Sangmin Lee2026.05.06

Agent Skills & Workflows

mckinsey-pptx는 컨설팅 덱 작성을 Claude Code 에이전트 작업...

seulee26/mckinsey-pptx는 맥킨지 스타일 슬라이드 40종을 Python PPTX 엔진으로 구현하고, 그 위에 Claude Code 플러그인·서브에이전트·슬래시 커맨드를 얹어 사용자의 짧은 브리프를...

Sangmin Lee2026.05.06

Agent Skills & Workflows

SkillsMP는 흩어진 SKILL.md 생태계를 검색 가능한 마켓플레이스로 바...

SkillsMP는 GitHub 전역에 흩어진 SKILL.md 기반 에이전트 스킬을 수집해 의미 검색, 직군 분류, 카테고리 탐색, API 접근, 설치 가이드까지 한 화면으로 묶어 Claude Code·Codex·...

Sangmin Lee2026.05.06

Agent Skills & Workflows

paper2code는 논문 구현의 애매함을 코드 옆에 드러낸다

paper2code는 arXiv 논문을 구현할 때 LLM이 빈칸을 자신 있게 메워버리는 문제를 막기 위해, 구현 결과를 citation-anchored code·ambiguity audit·walkthrough...

Sangmin Lee2026.05.06

Agent Skills & Workflows

Superpowers는 코딩 에이전트에 방법론을 주입한다

obra/superpowers는 Claude Code, Codex, Gemini CLI, Cursor 같은 코딩 에이전트에 스킬 라이브러리와 강제 워크플로우를 주입해, 즉흥적인 프롬프트 코딩을 설계-계획-TDD-...

Sangmin Lee2026.05.06

Agent Skills & Workflows

Hugging Face Skills는 에이전트용 AI 워크플로우를 패키지화한다

Hugging Face Skills는 모델 학습, 데이터셋 탐색, 평가, 로컬 추론 같은 AI 작업 지식을 SKILL.md 기반 패키지로 묶어 Claude Code, Codex, Gemini CLI, Cursor...

Sangmin Lee2026.05.06