ZAYA1-8B는 AMD에서 학습한 초소형 활성 reasoning MoE를 te...
Zyphra의 ZAYA1-8B는 약 0.7B 활성·8B급 총 파라미터의 reasoning MoE 위에 CCA, MLP router, learned residual scaling, Markovian RSA를 결합해...
Blog
Zyphra의 ZAYA1-8B는 약 0.7B 활성·8B급 총 파라미터의 reasoning MoE 위에 CCA, MLP router, learned residual scaling, Markovian RSA를 결합해...
TabEmbed는 TabBench를 통해 표형 임베딩을 classification과 retrieval의 공통 표현 문제로 재정의하고, language-to-row contrastive learning으로 범용 t...
UniPool은 MoE에서 레이어마다 따로 들고 있던 expert 집합을 전역 공유 풀로 바꾸고, pool-level balancing과 NormRouter를 더해 깊이에 비례하던 expert 파라미터 증가를 느...
Auto Research는 specialist agent가 코드 수정, 실험 제출, 외부 evaluator 피드백 반영을 반복하는 closed-loop 연구 하네스를 제안한다. 핵심 산출물은 논문 초안이 아니라...
LoPE는 hard question에서 실패한 롤아웃에 Lorem Ipsum 기반 프롬프트 교란을 추가해 GRPO의 zero-advantage 병목을 깨고, prompt-space exploration이 단순 추...
getdesign.md는 Google Stitch의 DESIGN.md 포맷을 70여 개 브랜드 레퍼런스, 웹 프리뷰, 설치 명령, 저장/북마크 지표, 프라이빗 요청 흐름까지 갖춘 카탈로그로 감싸면서 '디자인 감각...
WithWoz/wozcode-plugin은 Claude Code의 기본 파일 도구를 smart search, batch editing, SQL introspection, subagent delegation으로 대...
Skills-Coach는 LLM 에이전트 스킬을 자동으로 테스트하고, Training-Free GRPO로 문서와 코드를 다듬고, 원본과 최적화본을 비교 평가하는 self-evolving optimizer 프레임워...
X2SAM은 텍스트 프롬프트와 시각 프롬프트를 하나의 인터페이스로 묶고, Mask Memory와 joint training으로 이미지와 비디오 전반의 segmentation을 통합한 MLLM이다. 특히 V-VGD...
Peking University의 SSL 논문은 SKILL.md 중심의 텍스트 스킬을 스케줄링·구조·논리 3계층 표현으로 정규화해, 스킬 검색과 사전 위험 검토를 더 기계 친화적으로 만들 수 있음을 보여준다.
Q00/ouroboros는 막연한 아이디어를 곧바로 코드로 보내지 않고, 소크라테스식 인터뷰·불변 Seed 명세·다단계 평가·진화 루프로 감싸 replayable한 실행 계약으로 바꾸는 specification-...
Ctx2Skill은 복잡한 문맥에서 규칙과 절차를 자연어 스킬로 추출해 언어모델의 context learning을 강화하는 self-play 프레임워크로, 인간 주석과 외부 실행 피드백 없이도 closed-sou...