Subterranean Agent는 에이전트 워크플로를 가중치에 컴파일한다
arXiv 2605.22502는 외부 오케스트레이터가 매 턴 절차를 주입하는 대신, 절차형 agent workflow를 작은 fine-tuned model의 가중치에 내재화하면 near-frontier 품질을 훨...
Tag
Agent Orchestration 태그가 붙은 글입니다.
arXiv 2605.22502는 외부 오케스트레이터가 매 턴 절차를 주입하는 대신, 절차형 agent workflow를 작은 fine-tuned model의 가중치에 내재화하면 near-frontier 품질을 훨...
Sakana AI의 RL Conductor는 7B 모델이 GPT-5, Gemini, Claude, 오픈 모델을 직접 풀어 쓰는 대신 자연어 워크플로를 설계하도록 RL로 학습한 에이전트 오케스트레이션 논문이다.