badcasedaily1 8 авг в 21:26

От текста к краткому изложению: библиотека Sumy

Простой

4 мин

1.7K

Блог компании OTUSPython*Программирование*Natural Language Processing*

Обзор

+12

Комментарии 4

titulusdesiderio 8 авг в 22:38

А можно пожалуйста во все примеры ещё добавить результаты на выходе?

+10

Adgh 9 авг в 13:02

В примерах для русскоязычного текста используется токенизатор английского (Tokenizer("english")). Это ошибка или так и задумано? Неужели нет разницы?

Adgh 9 авг в 13:04

И стоит добавить в примеры:

import nltk nltk.download('punkt')

без этого не завелось

CA2004HR 12 авг в 08:52

_pickle.UnpicklingError: global 'nltk.tokenize.punkt.PunktSentenceTokenizer' is forbidden

вот такая проблема возникает

Зарегистрируйтесь на Хабре, чтобы оставить комментарий