Комментарии 7
Ссылка на архив, кажется, неправильная. Оригинальная статья тут.
А я правильно понимаю что использование сетей с вниманием в применении к тексту можно считать, по сути, некоторым развитием базовых алгоритмов типа tf-idf? Ну то есть могут решаться похожие задачи выделения контекста.
Вы очень хорошо выделяете и объясняете основные аспекты — мало текста, много смысла. Спасибо за информацию!
Про Recursive Cortical Networks будет?
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Transformer — новая архитектура нейросетей для работы с последовательностями