Search
Write a publication
Pull to refresh
7
0
Виктор Бырда @byrdas

SAS Consultant

Send message
К сожалению в R нету грамотного словаря для сентиментального анализа для русского языка (для английского есть библиотеки с шикарными словарями). Поэтому пришлось пользоваться внешним со своим дополнением. Вот Вам ссылка на него, с полным описанием:
github.com/dkulagin/kartaslov/tree/master/dataset/emo_dict

Категорически с Вами согласен на счёт последнего пункта) поэтому всегда стараюсь отдать для редактирования нескольким людям, дабы сгладили мои выводы)
Спасибо ещё раз за отзыв.

Постараюсь ответить по пунктам:

1. Децл — рискну предположить, что у него довольно широкий словарный запас. Вы наверное перестали следить за его творчеством после альбома «Кто? ты». Советую для прослушивания, к примеру альбом «Неважно кто там у руля».

2. Понятное дело, что Каста и Нойз Мс не определяют старую школу, есть множество других артистов, тот же упомянутый Вами Гуф и Витя Ак, но еще есть Лигалайз, Мастер Шеff, Баста, Кровосток и тд. Я и не пытался доказать кому-то и навязать своё мнение, что артисты из старой школы более талантливые. Они есть, но естественно не все. И приведённый Вами пример «хита» явно это доказывает. В своей работе я подметил, что «Музыкальный вкус дело индивидуальное и каждый сам решает, что ему слушать». Будь то Нойз, Каста, Оксимирон с одной стороны, или Фараон, Моргенштерн, Gone.Fludd с другой(что не мешает конечно же слушать их всех и быть самым счастливым)

3. ATL мне трудно отнести к новой, так как он в творчестве с 2006 года.

4. Выборка нерепрезентативная, я с Вами полностью согласен. Но тут вопрос, кого взять для анализа, чтобы была репрезентативная? Ответ скорее всего будет — практически всех. У каждого свой почерк и стиль, есть много андрерграудной рэп музыки. И всегда будет кто-то, кто скажет, что выборка плоха, так как нету того или иного артиста.

Количество слов явно не является предопределяющим звеном в качестве песен, ведь тогда у классики были бы большие проблемы в конкурентноспособности.

5. И последнее, глобальной целью моей работы было показать, как можно применить text mining в довольно интересной теме, может кто-то сможет почерпнуть для себя что-то новое, и я буду несказанно этому рад.

И спасибо за Ваш отзыв, надеюсь, что в целом, статья доставила Вам удовольствие при прочтении
Mystem нужен для того, чтобы найти основы слов для заданных исходных. На пример, имеем слова: «красивый, красивая, красивейший, красивее» — исходным словом для них является «красивый». Процесс, «стемминг», нужен именно для этого. И программа mystem помогает это сделать. Ведь не хотелось считать несколько раз вариативность на пример, слова «красивый». Целью было найти и показать уникальные слова, которые использовали артисты. А весь анализ был сделан в R. Это довольно длительный процесс, который кроме стемминга включает еще несколько этапов.
Спасибо, очень приятно слышать, что понравилось. На днях займусь анализом двух словесных гениев — Нойза и Оксимирона, с бонусом в виде Дяди Жени.
Полностью с Вами согласен и разделяю существование данной особенности. Только я лишь хотел показать, как отличается музыка\тексты кумиров моей молодости (Каста немного раньше, и чуть позже Нойз Мс) с кумирами нынешней молодёжи (довольно хорошо знаком с популярностью Фараона и Моргенштерна в 2020). Плюс к этому, хотел представить возможности R и Text Mining, так как после прогугливания не нашёл сравнения русской музыкальной сцены используя данные инструменты. И конечно, каждый вправе решать сам, что ему слушать. Я лишь хотел показать явные отличия и ни в коем случае не хотел навязывать свои предпочтения, лишь сделал выводы опираясь на полученных результатах.
Тоже сначала думал показать кол-во слов в разных песнях, откинуть экстремальные случаи(вот как к примеру слово «дед» у Моргенштерна) и потом уже показать наиболее часто повторяющиеся слова. Но потом решил, что некоторые люди заслушивают до «дыр» единичные песни, и у кого-то засядет в голове «дед», а у кого-то связка слов «Рок — это кал», поэтому не стал выбрасывать.

А на счёт Оксимирона, хотел его в этом же анализе разобрать, но они с Нойзом явно 2 лидера по текстам, и сильно бы выделялись из всех. Даже не так. Каста, Нойз и Окси с явным превосходством затмили бы Фараона и Моргенштерна.

А вот сравнить отдельно Оксимирона и Нойза довольно интересно. Наверное этим и займусь

Information

Rating
Does not participate
Location
Гродно, Гродненская обл., Беларусь
Date of birth
Registered
Activity