Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
from spacy.lang.ru import Russian
"""
После импорта и создания экземпляра языковой модели
можно начинать обработку текста. Для этого нужно
всего лишь передать текст созданному экземпляру:
"""
nlp = Russian()
doc = nlp("Съешь ещё этих мягких французских булок, да выпей чаю.")
"""
Работа с получившимся объектом Doc очень схожа с работой со списками:
можно обращаться к нужному токену по индексу или делать срезы
из нескольких токенов. А чтобы получить текст токена или среза,
можно использовать атрибут text:
"""
token = doc[0]
print(f"{token.text =}")
span = doc[3:6]
print(f"{span.text =}")
"""
Съешь
мягких французских булок
"""
Traceback (most recent call last):
File "Z:\......\venv\lib\site-packages\spacy\lang\ru\lemmatizer.py", line 15, in
__init__
from pymorphy2 import MorphAnalyzer
ModuleNotFoundError: No module named 'pymorphy2'
.....
ImportError: The Russian lemmatizer requires the pymorphy2 library: try to fix it with "pip install pymorphy2==
0.8" or "pip install git+https://github.com/kmike/pymorphy2.git pymorphy2-dicts-uk"if you need Ukrainian too
добрый день! получили ли Вы конфиленс представленного моделью ответа? т е, когда модель говорит, что Москва - это город, как получить % уверенности, с которой отработала модель. Смотрим через оценку луча (beam search, но не выходит с этим пока разобраться).
Можно всё: решение NLP задач при помощи spacy