Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
Спасибо, может быть немного не в тему, но есть вопрос — каким образом можно рассчитать эмоциональную окраску текста?
То есть на входе: текст на русском языке, а на выходе какое-то число, обозначающее эмоциональную окраску этого текста, исходя из которого можно с определенностью сказать позитивный этот текст или негативный.
С помощью нейронных сетей. На Kaggle были соревнования по этой задаче.
https://habr.com/ru/post/263171/ здесь про тональности
https://habr.com/ru/post/478790/ — здесь общий обзор всяких nlp штук с кучей ссылок
Если упорядочить уникальные символы по их частоте использования в тексте, как это сделано в секции transitions, то можно заметить, что этот порядок очень схож для каждого конкретного языка. Этот порядок логично будет назвать символьным спектром. То есть уже только по этому признаку (спектру) можно обучить нейросеть определять язык текста на лету.
Физика текста. Часть 1. Символы