Как стать автором
Обновить

Комментарии 2

С облаком слов получилось лучше, но для этого текст пришлось также немного обработать

Облако слов — штука условная, вы смещаете баланс либо в сторону эстетики, стараясь заполнить всё пространство по маске, либо в сторону математики, стараясь вывести реальную соразмерность слов (relative_scaling 0-1, по дефолту 0.5). В любом случае результаты будут разниться. И входные данные нужно прогнать через лемматизатор текста для более точной картины (либы для ru: natasha; pymorphy; pylem).

Спасибо за упоминание параметра relative_scaling, я его оставил по умолчанию. Использовал MyStem, в статье есть ссылка на блокнот, там наглядно показано, как меняется вид облака: https://github.com/BogdanPetrov/dq_vacancies/blob/main/03_wordcloud.ipynb

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации