Комментарии 9
Укажите уж тогда сразу и русские модели для Spacy: github.com/buriy/spacy-ru/releases/tag/v2.3_beta
Да и примеры могли тогда сразу русские взять и продемонстрировать работу…
Да и примеры могли тогда сразу русские взять и продемонстрировать работу…
Добрый день, да, при подготовке статьи рассматривали русскоязычные модели, в том числе ru2 (упоминали её во втором пункте).
Она покрывает многие, но пока не все возможности spaCy, поэтому для обзора взяли англоязычную модель.
Она покрывает многие, но пока не все возможности spaCy, поэтому для обзора взяли англоязычную модель.
И какие же возможности она не покрывает?
Мы рассматривали релизную ветку master, где ещё нет моделей для подсчёта векторов и семантической близости. Изучив development ветки действительно нашли, что и эти функции уже в разработке.
после удачной инстал. spacy, запускал это:
получил ошибку:
сделал, как оно советовало,
и тогда пошло удачно.
from spacy.lang.ru import Russian
"""
После импорта и создания экземпляра языковой модели
можно начинать обработку текста. Для этого нужно
всего лишь передать текст созданному экземпляру:
"""
nlp = Russian()
doc = nlp("Съешь ещё этих мягких французских булок, да выпей чаю.")
"""
Работа с получившимся объектом Doc очень схожа с работой со списками:
можно обращаться к нужному токену по индексу или делать срезы
из нескольких токенов. А чтобы получить текст токена или среза,
можно использовать атрибут text:
"""
token = doc[0]
print(f"{token.text =}")
span = doc[3:6]
print(f"{span.text =}")
"""
Съешь
мягких французских булок
"""
получил ошибку:
Traceback (most recent call last):
File "Z:\......\venv\lib\site-packages\spacy\lang\ru\lemmatizer.py", line 15, in
__init__
from pymorphy2 import MorphAnalyzer
ModuleNotFoundError: No module named 'pymorphy2'
.....
ImportError: The Russian lemmatizer requires the pymorphy2 library: try to fix it with "pip install pymorphy2==
0.8" or "pip install git+https://github.com/kmike/pymorphy2.git pymorphy2-dicts-uk"if you need Ukrainian too
сделал, как оно советовало,
и тогда пошло удачно.
По поводу «Выделение именованных сущностей».
Есть какие-то сравнения с библиотекой Flair в плане точности? Я знаю, что SpaCy лучше по производительности, но интересует именно точность.
Есть какие-то сравнения с библиотекой Flair в плане точности? Я знаю, что SpaCy лучше по производительности, но интересует именно точность.
добрый день! получили ли Вы конфиленс представленного моделью ответа? т е, когда модель говорит, что Москва - это город, как получить % уверенности, с которой отработала модель. Смотрим через оценку луча (beam search, но не выходит с этим пока разобраться).
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Можно всё: решение NLP задач при помощи spacy