Kouki_RUS3 ноя 2020 в 12:00Переосмысление механизма внимания с PerformersВремя на прочтение9 минОхват и читатели4.7KМашинное обучение * ПереводВсего голосов 3: ↑3 и ↓0+1Добавить в закладки21Комментарии2
DaniyarM3 ноя 2020 в 13:24А что за внимание с ReLU? Показано, что оно лучше, но не слова о том, что это.
Kouki_RUS3 ноя 2020 в 13:57Показать предыдущий комментарийАвторы в данной статье на этом не акцентировали внимание. Более подробно про внимание с ReLU можно прочитать в исходной работе: arxiv.org/abs/2009.14794
Переосмысление механизма внимания с Performers