SAE: введение, пояснение и код

Привет, друзья! В прошлой статье мы разобрали идею применения автоэнкодеров к трансоформерам. Там весь наш pipeline проходил на идее сжатия признакового пространства так, чтобы поделить кошек и собак. Но что делать, если у нас не задача классификации, а задача next token prediction? Да и признаки не соответствуют «собакам» и «кошкам», а охв атывают все богатство естественного языка...
Ответ сообщества сейчас такой — давайте использовать SAE. Как? Разбираем основы в статье.

















