Обновить
0
Александр Калинин@alexdel

Пользователь

Отправить сообщение
Теоретически, и тот, и другой поддерживают русский. Но в NLPK поддержка русского языка совсем мизерная. Насколько я знаю, в NLTK есть только корпус русских стоп-слов (предлоги, союзы и т.д.). Все остальное про русский язык ему неведомо.

В spaСy есть поддержка разметки частей речи (POS-tagging) для русского, НО она сделано через сторонний анализатор pymorphy2. Всех остальных приятных вещей вроде синтаксического анализа, предобученных векторов слов и прочего (что там доступно, например для английского) там нет. Единственный луч надежды — это гибкая архитектура spaCy, позволяющая под его API прикручивать любые расширения и добавлять другие языки.

В общем NLTK почти не поддерживает русский, spaCy поддерживает его немного.

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность

Специализация

Бэкенд разработчик, ML разработчик
Старший