Articles / Profile of rfveskin / Habr

@rfveskin

User

ProfileArticles6PostsNewsComments11

rfveskin Jul 18 2021 at 13:01

Модели глубоких нейронных сетей sequence-to-sequence на PyTorch (Часть 6)

25 min

6.9K

Python * Machine learning *

Tutorial

Translation

В этом разделе мы будем реализовывать (слегка измененную версию) модели Transformer из статьи Attention is All You Need. Подобно свёрточной модели Sequence-to-Sequence, Transformer не использует никакой рекуррентности. Он также не использует свёрточные слои. Вместо этого модель полностью состоит из линейных слоев, механизмов внимания и нормализации.

rfveskin Jul 16 2021 at 22:37

Модели глубоких нейронных сетей sequence-to-sequence на PyTorch (Часть 5)

23 min

4.4K

Python * Machine learning *

Tutorial

Translation

В этом разделе мы будем реализовывать модель из статьи Convolutional Sequence to Sequence Learning.

Эта модель кардинально отличается от предыдущих моделей, реализованных нами. Здесь вообще не используются рекуррентные компоненты. Вместо этого применяются свёрточные слои (CNN), обычно используемые для обработки изображений.

rfveskin Jul 15 2021 at 21:07

Модели глубоких нейронных сетей sequence-to-sequence на PyTorch (Часть 4)

19 min

3.8K

Machine learning * Python *

Tutorial

Translation

В этой части мы добавим несколько улучшений — упакованные дополненные последовательности и маскировка — к модели из предыдущего раздела. Упакованные дополненные последовательности используются, чтобы сообщить нашей RNN, что нужно пропускать маркеры заполнения в нашем кодировщике. Маскировка явно заставляет модель игнорировать определенные значения, такие как внимание к элементам с заполнением. Оба эти метода обычно используются в обработке естественного языка (NLP).

Кроме того, мы рассмотрим как использовать нашу модель для вывода целевого предложения, давая ей входное предложение, видя результат её перевода, и выясняя, на что именно она обращает внимание при переводе каждого слова.

Наконец, мы будем использовать метрику BLEU для измерения качества наших переводов.

rfveskin Jul 14 2021 at 21:41

Модели глубоких нейронных сетей sequence-to-sequence на PyTorch (Часть 3)

13 min

4.2K

Python * Machine learning *

Tutorial

Translation

В этом третьем посте о моделях sequence-to-sequence с использованием PyTorch и torchText мы будем реализовывать модель из стать Neural Machine Translation by Jointly Learning to Align and Translate. Эта модель демонстрирует лучшую точность из из трёх моделей (~27 по сравнению с ~34 у предыдущей модели).

rfveskin Jul 13 2021 at 22:11

Модели глубоких нейронных сетей sequence-to-sequence на PyTorch (Часть 2)

10 min

7.2K

Python * Machine learning *

Tutorial

Translation

Во втором разделе учебных материалах о моделях sequence-to-sequence с использованием PyTorch и TorchText мы будем реализовывать модель из работы Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation. Эта нейронная сеть позволит достичь лучшей точности при использовании только однослойной RNN как в кодере, так и в декодере.

rfveskin Jul 11 2021 at 16:31

Модели глубоких нейронных сетей sequence-to-sequence на PyTorch (Часть 1)

24 min

22K

Python * Machine learning *

Tutorial

From sandbox

Translation

Этот туториал содержит материалы полезные для понимания работы глубоких нейронных сетей sequence-to-sequence (seq2seq) и реализации этих моделей с помощью PyTorch 1.8, torchtext 0.9 и spaCy 3.0, под Python 3.8. Материалы расположены в эволюционном порядке: от простой и неточной модели к сложной и обладающей наибольшей точностью.