Anthropic의 NLA는 Claude의 ‘속생각’을 자연어로 압축해 읽으려는...
Anthropic의 Natural Language Autoencoders는 Claude의 activation을 자연어 설명으로 바꾸고 다시 activation으로 복원하는 왕복 구조를 통해, 모델이 말하지 않은...
Tag
Natural Language Autoencoders 태그가 붙은 글입니다.
Anthropic의 Natural Language Autoencoders는 Claude의 activation을 자연어 설명으로 바꾸고 다시 activation으로 복원하는 왕복 구조를 통해, 모델이 말하지 않은...