Как стать автором
Обновить

Инженеры из «Яндекс Музыки» научили «Балабобу» писать романтическую лирику

Время на прочтение2 мин
Количество просмотров1.1K

Создатели «Яндекс Музыки» научили языковую модель YaLM «Балабоба» писать романтические куплеты, сообщили информационной службе Хабра в пресс‑службе сервиса. Создатели проанализировали различные тексты, и оказалось, что в поп‑музыке более 72% песен посвящены любви. На втором месте оказался шансон, а реже всего о светлом чувстве поют рэперы и рокеры — 27% и 28%.

Анализ проводился по характерным словам: у поп-музыки это «винишко», «наболеть» и «по-английски», у рэперов — «дилер» и «поделом», а  у исполнителей шансона — «девчоночка» и «черемуха». 

Кроме того, по результатам анализа любовная лирика оказалась чаще печальная: позитивных треков чуть больше 10%, что в пять раз меньше, чем меланхоличных. Самыми оптимистичными жанрами стали поп и рэп, а самыми пессимистичными стали инди и рок. В грустных песнях по анализу часто встречались глаголы, которые прощают и отпускают, убивают и умирают, молчат и кричат. Что касается радостных песен, в них чаще танцуют, нравятся, улыбаются, манят, крадут (любовь, сердца, сны), сияют и целуются. 

Ну и самым частотным словом стало «любовь». Оно встречается практически в каждом втором из отобранных текстов. Далее за ним идут слова «знать», «хотеть», «глаза», «один», «любить», «сердце» и «ночь». И конечно же, в любовной лирике эти слова встречаются чаще, чем в других текстах.

Среди часто встречающихся растений характерно упоминание ромашек, роз, а из животных в лиричных треках чаще упоминаются мотыльки. Из еды в лирических текстах больше всего встречаются шоколад, кофе и вишня.

После изучения «Балабобой» нескольких тысяч треков о любви на «Яндекс Музыке» она сама научилась сочинять куплеты. Если ввести первую строчку, «Балабоба» сам закончит четверостишие.

База русскоязычной любовной лирики для исследования была создана пользователями «Толоки». Пользователи изучили 20 тысяч треков, где выделили около 8,5 тысяч песен о любви. Потом они проанализировали тексты и нашли самые характерные и нехарактерные слова: действия, предметы одежды, продукты, даже животных и растения, которые встречаются в треках.

Теги:
Хабы:
Всего голосов 6: ↑6 и ↓0+6
Комментарии3

Другие новости

Ближайшие события

Конференция «IT IS CONF 2024»
Дата20 июня
Время09:00 – 19:00
Место
Екатеринбург
Summer Merge
Дата28 – 30 июня
Время11:00
Место
Ульяновская область