Articles / Bookmarks / Profile of morozowdm / Habr

rfveskin Jul 18 2021 at 16:01

Модели глубоких нейронных сетей sequence-to-sequence на PyTorch (Часть 6)

25 min

6.3K

Python*Machine learning*

Tutorial

Translation

В этом разделе мы будем реализовывать (слегка измененную версию) модели Transformer из статьи Attention is All You Need. Подобно свёрточной модели Sequence-to-Sequence, Transformer не использует никакой рекуррентности. Он также не использует свёрточные слои. Вместо этого модель полностью состоит из линейных слоев, механизмов внимания и нормализации.

Модели глубоких нейронных сетей sequence-to-sequence на PyTorch (Часть 6)

Information

Specialization