Pull to refresh
4
Mikhail Konovalov@8Michelle

User

Send message

Как на самом деле работает Attention

Level of difficultyHard
Reading time8 min
Reach and readers7.6K

Как именно работают механизмы, которые позволяют LLM так эффективно взаимодействовать с контекстом? Принято рассматривать нейронные сети как black-box, не разбираясь, что на самом деле происходит во время их инференса. Однако можно немного заглянуть «в мозги» нейронным сетям и попытаться понять, за что отвечают те или иные группы параметров модели.

Меня зовут Михаил Коновалов, я работаю ML-инженером в Okko. В этой статье я хочу рассмотреть несколько публикаций, посвященных интерпретации механизма Attention в трансформерах.

Читать далее

Information

Rating
Does not participate
Date of birth
Registered
Activity