Kouki_RUS3 ноя 2020 в 12:00Переосмысление механизма внимания с PerformersВремя на прочтение9 минОхват и читатели4.9KМашинное обучение * ПереводВсего голосов 4: ↑4 и ↓0+4Добавить в закладки22ПоделитьсяКомментарии2
DaniyarM3 ноя 2020 в 13:24А что за внимание с ReLU? Показано, что оно лучше, но не слова о том, что это.
Kouki_RUS3 ноя 2020 в 13:57Показать предыдущий комментарийАвторы в данной статье на этом не акцентировали внимание. Более подробно про внимание с ReLU можно прочитать в исходной работе: arxiv.org/abs/2009.14794
Переосмысление механизма внимания с Performers