Статьи / Профиль rfveskin / Хабр

@rfveskin

Пользователь

ПрофильСтатьи6ПостыНовостиКомментарии11

@rfveskin 18 июл 2021 в 13:01

Модели глубоких нейронных сетей sequence-to-sequence на PyTorch (Часть 6)

25 мин

8.1K

Python * Машинное обучение *

Туториал

Перевод

В этом разделе мы будем реализовывать (слегка измененную версию) модели Transformer из статьи Attention is All You Need. Подобно свёрточной модели Sequence-to-Sequence, Transformer не использует никакой рекуррентности. Он также не использует свёрточные слои. Вместо этого модель полностью состоит из линейных слоев, механизмов внимания и нормализации.

@rfveskin 16 июл 2021 в 22:37

Модели глубоких нейронных сетей sequence-to-sequence на PyTorch (Часть 5)

23 мин

4.8K

Python * Машинное обучение *

Туториал

Перевод

В этом разделе мы будем реализовывать модель из статьи Convolutional Sequence to Sequence Learning.

Эта модель кардинально отличается от предыдущих моделей, реализованных нами. Здесь вообще не используются рекуррентные компоненты. Вместо этого применяются свёрточные слои (CNN), обычно используемые для обработки изображений.

@rfveskin 15 июл 2021 в 21:07

Модели глубоких нейронных сетей sequence-to-sequence на PyTorch (Часть 4)

19 мин

4.4K

Машинное обучение * Python *

Туториал

Перевод

В этой части мы добавим несколько улучшений — упакованные дополненные последовательности и маскировка — к модели из предыдущего раздела. Упакованные дополненные последовательности используются, чтобы сообщить нашей RNN, что нужно пропускать маркеры заполнения в нашем кодировщике. Маскировка явно заставляет модель игнорировать определенные значения, такие как внимание к элементам с заполнением. Оба эти метода обычно используются в обработке естественного языка (NLP).

Кроме того, мы рассмотрим как использовать нашу модель для вывода целевого предложения, давая ей входное предложение, видя результат её перевода, и выясняя, на что именно она обращает внимание при переводе каждого слова.

Наконец, мы будем использовать метрику BLEU для измерения качества наших переводов.

@rfveskin 14 июл 2021 в 21:41

Модели глубоких нейронных сетей sequence-to-sequence на PyTorch (Часть 3)

13 мин

4.5K

Python * Машинное обучение *

Туториал

Перевод

В этом третьем посте о моделях sequence-to-sequence с использованием PyTorch и torchText мы будем реализовывать модель из стать Neural Machine Translation by Jointly Learning to Align and Translate. Эта модель демонстрирует лучшую точность из из трёх моделей (~27 по сравнению с ~34 у предыдущей модели).

@rfveskin 13 июл 2021 в 22:11

Модели глубоких нейронных сетей sequence-to-sequence на PyTorch (Часть 2)

10 мин

8.3K

Python * Машинное обучение *

Туториал

Перевод

Во втором разделе учебных материалах о моделях sequence-to-sequence с использованием PyTorch и TorchText мы будем реализовывать модель из работы Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation. Эта нейронная сеть позволит достичь лучшей точности при использовании только однослойной RNN как в кодере, так и в декодере.

@rfveskin 11 июл 2021 в 16:31

Модели глубоких нейронных сетей sequence-to-sequence на PyTorch (Часть 1)

24 мин

25K

Python * Машинное обучение *

Туториал

Из песочницы

Перевод

Этот туториал содержит материалы полезные для понимания работы глубоких нейронных сетей sequence-to-sequence (seq2seq) и реализации этих моделей с помощью PyTorch 1.8, torchtext 0.9 и spaCy 3.0, под Python 3.8. Материалы расположены в эволюционном порядке: от простой и неточной модели к сложной и обладающей наибольшей точностью.