kmoseenk Sep 12 2022 at 15:01

Обработка естественного языка (NLP) методами машинного обучения в Python

11 min

31K

OTUS corporate blogPython*Machine learning*

+11

Comments 4

QtRoS Sep 12 2022 at 15:15

В целом неплохая статья, базовая работа с текстом разобрана, но:

Вроде как уже неоднократно было такое на Хабре
Даже на ноутбуках можно использовать модели по типу BERT или USE, скорее всего они обойдут классические bag-of-words-like подходы по качеству, например благодаря адекватной обработке отрицаний (частицы "не" в частности)

BubaVV Sep 13 2022 at 01:15

USE так назвали, чтобы никто не нашел. Я кстати сталкивался прямо с такой сеткой как в статье на проде, со своими задачами справлялось просто и быстро

QtRoS Sep 13 2022 at 11:16

"Просто" это действительно сильный аргумент, и у меня тоже TF-IDF работает в проде :)
Кстати USE лучше гуглить по расшифровке, тогда сразу приводит на TF Hub. Кстати если кто знает годную PyTorch реализацию - буду благодарен за ссылку.

dulapeep Sep 15 2022 at 18:05

Спасибо за статью, очень интересно читать про NLP.