Qwen-Scope는 SAE를 해석 도구에서 개발 인터페이스로 밀어 올린다
Qwen-Scope는 Qwen3·Qwen3.5 계열 7개 모델에 대해 14개 그룹의 sparse autoencoder를 공개하고, 이를 추론 조종·벤치마크 분석·안전 데이터 합성·사후 훈련 최적화까지 연결해 SAE를 사후 해석 기법이 아니라 재사용 가능한 개발 인터페이스로 재정의하려는 시도다.
Tag
Open Weights 태그가 붙은 글입니다.
Qwen-Scope는 Qwen3·Qwen3.5 계열 7개 모델에 대해 14개 그룹의 sparse autoencoder를 공개하고, 이를 추론 조종·벤치마크 분석·안전 데이터 합성·사후 훈련 최적화까지 연결해 SAE를 사후 해석 기법이 아니라 재사용 가능한 개발 인터페이스로 재정의하려는 시도다.
EXAONE 4.5 33B는 31.7B 언어모델과 1.29B 비전 인코더를 결합한 LG AI Research의 첫 오픈 웨이트 VLM으로, 256K 컨텍스트와 문서 이해 중심 데이터 전략을 앞세워 범용 벤치마크보다 산업형 멀티모달 실전성에 무게를 둔 릴리스다.
Qwen3.6-35B-A3B는 총 35B·활성 3B의 멀티모달 MoE 구조 위에 agentic coding, preserve_thinking, 초장문 컨텍스트 확장, 오픈 배포 경로를 결합해 작은 활성 비용으로 실전형 코딩 에이전트 성능을 노리는 Qwen의 공개 모델이다.
Mistral Medium 3.5는 128B dense open-weight 모델 하나에 instruction following, reasoning, coding, vision, tool use를 통합하고, 이를 Le Chat과 Vibe의 장시간 에이전트 실행 계층에 바로 연결하려는 Mistral의 새 플래그십이다.