alexeyfv Jul 2 at 05:47

Треть новых релизов на Яндекс Музыке – ИИ. Теперь точно

Easy

5 min

25K

Machine learning * Artificial Intelligence

Analytics

+73

Comments 79

yesus1707 Jul 2 at 07:46

еще одна причина отказаться от подписки яндекс плюс

ProgerMan Jul 2 at 22:02

Я позавчера себе Spotify установил как раз из-за нейрослопа на Яндексе.

THEOILMAN Jul 3 at 04:06

Там дела не сильно лучше. Держу его только потому, что знаю, что хочу послушать. Рекомендации так же в дерьме.

achekalin Jul 3 at 05:50

Ну, значит, держат марку.

Я вот на днях включил "моб волну" в этом расфуфыпенном веб-интерфейсе, который жрёт почему-то, мой проц на отрисовку совсем ненужной мне (при прослушивании в фоне) анимации - и понял, что музыку он дает ровно из той, что я налайкал годы назад.

Те вроде не напрягает музыка, но - это же волна рекомендательного характера, по идее, а не просто "включи мой favorites"!

А что за контентом не следят уже с двух направлений (т.е. нормальный контент теряют, заменяя всякими перепевками - а теперь вот и ии поощряя заполнять пустоту) - блин, тот еще звоночек

Zelinoff Jul 2 at 08:06

Лучше бы написали статью как от этого дерьма избавиться!

Пока вручную блокирую все, что не имеет релизов 2024 и раньше, но бесит😬

alexeyfv Jul 2 at 08:14

Так я написал. Посмотрите предыдущую статью.

iv_an_chel Jul 2 at 11:22

Подскажите, в вашем приложении можно помечать, но не блокировать/автоскипать ии-музыку? Просто есть некоторые ии-треки, которые мне нравятся, не хотелось бы их потерять

alexeyfv Jul 2 at 11:29

Да, там есть режим "Ничего не делать"

Скрытый текст

yahooyaks Jul 2 at 23:31

Если слушать разборчиво, то не бесит и блокировать нечего. Подписался на триал, залайкал всех понравившиеся исполнителей, скачал дискографии и слушай пол года.

nitro80 Jul 3 at 02:34

А вот не всё можно скачать, я не могу одного исполнителя скачать, как ни искал

yahooyaks Jul 3 at 05:41

А у меня противоположный опыт. Сектор газа зацезурен, Pizzicato Five - жалкие крохи, детские песни - стремные перепевки, какие-то композиции отмечены как нэнедостуые, какие-то альбомы отсутствуют впринципе. Только качать и остаётся.

ALT0105 Jul 2 at 08:18

Два вопроса: 1. Если слушателю нравится музыка, какая разница кто ее написал? 2. Если мешают выбросы в спектре ИИ-шной музыки, что мешает удалить их прямо в спектре - просто срезать выступающие гармоники или пропустить спектр через медианный фильтр, который сделает это аккуратнее, и обратным преобразованием Фурье получить музыку, неотличимую от человеческой?

alexeyfv Jul 2 at 08:23

Два ответа: 1. Я чужие вкусы и предпочтения не осуждаю. Нравится - пусть слушают. 2. Ничего не мешает, только зачем пытаться что-то скрывать?

UFO landed and left these words here

SolidSnack Jul 3 at 01:14

Хорошее замечание кстати, музыка стала слишком простой, что даже ИИшница выглядит реалистично)

Andreas_Fogel Jul 3 at 19:14

Вспомните музыку 90ых и 2000ых. Там как раз в топе была музыка из пары слов. Тогда бессловный Acid, Trance, Hip-hop, Eurodance, Rock, RAP. Текста там были примитивные в большей степени. Но музыку этих лет я слушаю чаще всего. Так как тогда сделать такое было желанием только сильных личностей.

ALT0105 Jul 2 at 08:50

Не скрывать, а убрать искажения, которых не должно быть в чистом звучании.

burstmode Jul 2 at 08:51

На счёт второго пункта: у ИИ-шной музыки не только в частотном спектре проблема. В плане аранжировки (и это актуально для всех нейросетей, включая Suno и Udio) там нет:

контр-мелодии/второго ведущего элемента , не считая истинную контр-мелодию в виде call-and-respone
контр-ритма - т. е. ритмических элементов, которые играют "мимо" основного ритма драмки
конфет для ушей (ear candy в оригинале), по-простому коротких звуковых деталей, которые не заметны на первом прослушивании (т. к. на первом прослушиваний слушатель фокусируется на основном лиде, гармонии, ударках и басе), но делают трек интереснее при повторных прослушиваниях

То есть, если мы слышим второй лид, гармонизирующий основной лид или два равнозначных лида, или контр-ритм (условные хай-хэты с off-beat паттернами), или ear candy в левом ухе в виде звука подброшенной монеты - трек 100% не нейрослоповый.

Проблема в том, что у очень многих людей ненатренерованный слух (они просто не обращают на эти элементы внимание, даже если их уши в принципе фиксируют их наличие в треке), плюс большинство слушает на довольно дешёвом аудиооборудовании, и там эти элементы аранжировки слышно хуже, чем на более-менее нормальных ушах вроде условных Soundcore Space One.

Если что, всё что я выше расписал, это мои личные наблюдения, а не копипаста откуда-то. Просто я некоторое время увлекался продюсированием и аранжировкой, и для себя отметил вот эти нюансы, когда игрался с Suno пятой версии где-то пару месяцев назад.

UPD: перечитал свой коммент, вышло так, что он отвечает и на первый первый вопрос "какая разница, кто написал, если нравится". Разница как раз в продолжительности жизни песни.

Типичный нейрослоповый трек без контр-мелодий, контр-ритма и ear candy может понравиться с первого раза благодаря яркому припеву или знакомой гармонии. Но она быстро надоест. На 3-й и 5-й раз слушать её будет скучно, потому что там нет глубины — уху не за что зацепиться, кроме первого плана. Человеческая музыка "живет" долго именно за счет этих скрытых слоев аранжировки. Даже если вы их не замечаете, ваши уши всё равно фиксируют их наличие в треке.

ALT0105 Jul 2 at 09:01

Я когда-то читал, что есть такие любители музыки, которые не ходят на концерты, потому что дирижёр дает своё восприятие, а не доносит в чистом виде написанное композитором. Поэтому они просто читают ноты. Кстати, ИИ же может сделать нотную запись?

burstmode Jul 2 at 09:34

Аналогия про дирижёра не в тему. Там спор про точность передачи чужого замысла: дирижёр интерпретирует, а не искажает. Я же говорю не про интерпретацию, а про физическое наличие или отсутствие определённых элементов в самой записи.

В отредактированном первом комментарии я уже упомянул, что эти элементы нужны для увеличения срока жизни песни, но это не единственная причина их добавления в трек. Есть довольно устойчивое наблюдение в психоакустике и звукорежиссуре: человеку не нравится стерильная цифровая тишина, и мозг лучше вовлекается в сигнал с лёгкой шумовой текстурой - отсюда фоновый шелест плёнки или розовый шум прямо в синтезаторе. Слушатель чаще всего не осознаёт эту деталь напрямую, а она всё равно влияет на то, нравится ему трек или нет. То же самое с контр-мелодией и ear candy - их не обязательно слышать, чтобы они делали своё дело.

По нотам - генераторы MIDI-последовательностей есть, но по факту это сырой черновик, а не готовое решение: библиотеки плохо оживляют такие партии, тайминг и артикуляцию всё равно приходится дотягивать руками.

piuzziconezz Jul 2 at 11:23

Это просто любители нот

yahooyaks Jul 3 at 06:11

Еженедельник "Музыкальная правда" читают.

nidalee Jul 3 at 04:20

Мне не нравятся концерты просто потому, что звук хуже. В студии его вылизывали, а на концерте сыграли как сыграли.

ALT0105 Jul 3 at 04:59

А я помню как с удовольствием слушал в филармонии игру на рояле Андрея Петрова, а слушать такую музыку в записи дома или в машине - не слушаю.

k4ir05 Jul 3 at 05:57

В филармонии другой настрой, и музыка воспринимается иначе. Да и акустика решает.

iv_an_chel Jul 3 at 08:29

Вы правы, академическую музыку лучше слушать вживую. Я после концерта пошёл и скачал все доступные записи Карла Орфа "O, fortuna!", но ни одна из них даже близко не передаёт того впечатления, что я получил вживую

zlobnayapomidorka Jul 2 at 10:09

Мне кажется чем дальше, тем умнее станут музыкописные ИИ. Уже сейчас ИИ предлагает попробовать не 1-Click песню написать, а накидать ее в условном FL-Studio. Если ее соберут таким способом и еще дополнительно не поленятся прошерстить и исправить недочеты - то такие треки будет крайне трудно отличить от настоящих.

Что на счет аранжировки, тут все зависит имхо от скилла промптописателя. В моем топе находиться данная композиция, где на мой взгляд ваши пункты частично покрываются:

Я ни разу не музыкант, поэтому могу ошибаться (Сообщество было бы очень радо если бы вы смогли привести примеры к каждому вашему описанному пункту. Нам очень интересно услышать человека из индустрии!).

Child of Ash and Thorn (Ютуб)

Отдельно хочу подчеркнуть что хоть в моем рационе и есть ИИ музыка, я потребляю ее разумно. И категорически против массового захламления интернета нейрослопом - пусть от YouTube отпочковывается AiTube, и засоряют там харды гугла сколько душе им влезет.

k4ir05 Jul 3 at 06:28

Мне кажется чем дальше, тем умнее станут музыкописные ИИ.

Но они никогда не станут лучше среднего.

По поводу примера. Я не спец (могу путаться в терминах и каких-то нюансах), но он же сильно отличается от живого симфо-метала. Слишком скудная мелодия. Ударная партия странная, тарелок, по-моему, вообще нет (местами есть какая-то имитация, но больше на шум похоже). Такое ощущение, что акцент делается только на вокал и одну из инструментальных партий. Играют ударные, потом вступает "гитара" - и ударные почти пропадают. Потом опять оживают ударные, но остальные "гитару" стихает и превращается в шум. Вибрато в вокале неестественные (на 50:44 особенно заметно), обертонов как будто вообще нет (стерильный голос), монотонный (меняется только высота, но нет акцентов и интонаций). Да и вообще голос похож на голоса в других ИИ-шных песен, нет уникальности.

vadimk91 Jul 2 at 11:45

Я подписан на одно сообщество, где регулярно выкладывают альбомы разных стилей. Так вот, то что называется Easy listening - по-моему нейрослопа там уже больше половины существенно, настолько эти треки однообразные и "одноразовые".

А еще я слушая музыку через не совсем дешевые колонки, вдруг поймал себя на мысли что нынешние записи почти перестали быть стерео, когда обращаешь внимание, что источник звука где-то локализован. Да и в звуковом редакторе открываешь трек, а картинка левого и правого канала практически одинакова.

ALT0105 Jul 3 at 08:37

Всё можно сделать, и объемное видео, и объемный звук, но это лишние затраты. Как сейчас модно говорить "А зачем?", ведь как говорили раньше - "Пипл хавает".

jakobz Jul 2 at 21:26

Я генерировал прилично всякого через suno и прочие. Нормально оно умеет всякое. Что-то плоховато, например не может насыпать готовых семплов для атмосферки. И если специально не просить сделать гармонию сложнее - генерит примитивное. Но если попросишь - полиритмы, контр-мелодии, микро-тональность - всё будет. Если там покрутить промпт, а еще и в DAW потом поработать - там можно пилить вещи, которые и ценитель не поймет что это AI.

Другое дело, когда просто в один присест промптом генерят «сделай реп чтобы топ в чарте» - там да, выходит нейрослоп лютый. Особенно, как ни странно, выдают тексты. Почему-то стихи выше среднего llm пока не могут.

Сходи в suno, попробуй всякое типа «microtonal polyrhythm, non-trivial harmony, post-rock”. Или просто «Bach-like classical”, вот например:

https://suno.com/song/ef59d683-60a2-497f-978c-7d28bcf06255

Нисколько не хочу приукрасить, и оправдать нейрослоп. Но оно, правда, умеет так, что офигеть.

nixtonixto Jul 3 at 03:06

трек без контр-мелодий, контр-ритма и ear candy может понравиться с первого раза благодаря яркому припеву или знакомой гармонии. Но она быстро надоест. На 3-й и 5-й раз слушать её будет скучно, потому что там нет глубины — уху не за что зацепиться, кроме первого плана. Человеческая музыка "живет" долго именно за счет этих скрытых слоев аранжировки.

Следуя вашей логике - музыка Сектора Газа, Ласкового мая и др. должна была потерять привлекательность после пятого прослушивания. Как вы прокомментируете то, что её слушают до сих пор?

nidalee Jul 3 at 04:21

За душу берет :)

k4ir05 Jul 3 at 06:37

Текста тащат) А ещё бывают нескучающие слушатели.

Fedorkov Jul 3 at 05:53

А я в первый раз отличил сгенерированную музыку по банальному тексту песни. Это был блюз типа такого.

k4ir05 Jul 3 at 05:50

Если слушателю нравится музыка, какая разница кто ее написал?

Если писал человек, то с большой вероятностью и другие его песни понравятся, поэтому можно на него подписаться и смело изучать всю дискографию.

ALT0105 Jul 3 at 05:55

А почему с ИИ вероятность не та?

yahooyaks Jul 3 at 06:20

Скорее всего, ИИшные треки не композиторы пилят, а автогенерация. Похоже на музыку? - давай в народ! Нет ни идеи, ни последовательности, ни приемственности.

ALT0105 Jul 3 at 06:25

А попсу (и музыку, и слова) люди пишут по-другому?

k4ir05 Jul 3 at 06:45

Над хорошей попсой всё же сильно стараются. И исполнитель, который хочет отличаться от остальных и быть успешным, обычно придерживается определённого стиля и качества.

ALT0105 Jul 3 at 06:49

Конечно, у каждого свой стиль. ИИ тоже делает в заданном стиле. И я думаю, ИИ-шная поп-музыка скоро легко обойдет человеческую и найдет своего слушателя. Но не меня.

k4ir05 Jul 3 at 06:41

Не могу сказать - у меня по ним статистика пока нулевая. Ещё ни одна ИИ-шная песня не понравилась.

ALT0105 Jul 3 at 06:44

Попса ничем не лучше и я не замечаю разницы. Было бы интересно послушать ИИ в стиле Beatles.

k4ir05 Jul 3 at 06:48

В массе своей - да, потому я её слушаю крайне избирательно. Хорошая иногда встречается.

iv_an_chel Jul 3 at 08:34

Можно зайти в ЯМ на страничку любого ии-исполнителя и увидеть, что стреляет одна-две песни, остальное прямо сильно слабее

Pythonpy Jul 2 at 08:58

Отличная статья! К сожалению это уже наша реальность. Фильтр ИИ был бы полезен. Зная как работает яндекс, могут маркировать ИИ и продавать отдельно.

iv_an_chel Jul 3 at 08:37

На самом деле надо просто понизить роялти для ии-музыки, чтобы было справедливое распределение между музыкантами, которые тратили на создание своей музыки время, усилия и деньги, и нейрослопщиками, которые тупо отгребают кассу

piton-vas Jul 4 at 12:43

Тогда появится дополнительная денежная мотивация обхода фильтров.

Q3_Results Jul 2 at 11:44

Осталось совсем чуть-чуть до Вашего создания сервиса по определению нейромузыки на Яндексе - ничто не мешает Вам запустить сайт с таким сервисом. Заодно и посмотрите, насколько на самом деле слушателям важно отличать истинную музыку от ИИ.

И второй момент - сэмплы и звуковые эффекты композиторы могут создавать так же с помощью ИИ, и может получиться так, что композитор сочинял свою музыку, а в итоге его обвиняют в том, что его музыка сгенерирована. Как точно разделять эту грань творчества?

alexeyfv Jul 2 at 12:16

Заодно и посмотрите, насколько на самом деле слушателям важно отличать истинную музыку от ИИ.

Расширение уже больше месяца существует. Сейчас WAU примерно 1000 человек.

Как точно разделять эту грань творчества?

Сервисы сами будут решать, судя по всему. Где-то будут разрешать музыку, где-то будут маркировать и демонетизировать. Deezer и Tidal вот маркируют и демонетизируют.

Mishootk Jul 2 at 14:48

После того как я поинтересовался одним исполнителем и прочитал, что он честно признается в том, что с помощью ИИ создает музыку и вокал, я стал замечать искусственные голоса и у других исполнителей. И вдруг все исполнение резко разделилось на голоса которые мне перестали нравиться и на нормальные песни.

В рамках данной статьи и обсуждения я так и не уловил до конца, обсуждается только музыка, или вокал тоже? Меня больше искусственный вокал напрягает. Как будто бы я в своей девушке вдруг разглядел резиновую бабу...

alexeyfv Jul 2 at 18:33

Я не делал разделения между только музыкой и вокалом. Анализировал все треки целиком.

Dartflame Jul 2 at 14:57

Новую музыку вообще не нужно слушать, только свежие релизы от проверенных временем музыкантов. А вообще у меня на плеере скачана коллекция рока от 60ых до нашего времени, в основном это 70ые и 80ые, там не было никакого ИИ и этого более чем достаточно, чтоб закрыть музыкальные потребности.

ИИ это худшее, что было с человечеством, но пути назад уже нет.

nitro80 Jul 3 at 03:11

Новую музыку вообще не нужно слушать

Ok, расскажите теперь нам, что же слушать?

yahooyaks Jul 3 at 06:33

Слушайте Annie Lennox

anwender95 Jul 6 at 08:11

Я опять старье слушаю)
У Depeche Mode и Judas Priest есть куча клевых песен.

nitro80 Jul 6 at 08:47

Наверняка старые волосатые наркоманы в трико?

bomitau Jul 3 at 04:04

Сейчас мало кто скачивает, многие просто не знают и не умеют, даже не слышали про рутрекер и то, что можно скачать дискографию или сериал целиком.

iv_an_chel Jul 3 at 08:39

Ну это какая-то старперская позиция. Я, например, устал от старого рок-репертуара и постоянно ищу что-то новенькое (и нахожу)

V8-350 Jul 4 at 06:56

«О дивный новый мир.»

Ну, нам, пожилым, старой музыки (будь то рок или электроника) на наш век хватит. Скаченные коллекции альбомов, самодельные сборники «микс тейпы» всегда с собой. На «облака» и «стриминги» не рассчитывал никогда.

В конце концов, если хочется чего-то новенькое, всегда можно послушать инструментальную музыку на выступлениях, даже в записи (с электроникой сложнее).

А молодёжь сама определится, что ей больше нравится. Со временем-то уж точно.

eggor Jul 2 at 18:32

Может и так, но качество релизов от этого не меняется. А жаль

alefiro Jul 2 at 20:52

Вот я думаю - что хуже? Убогий голый нейрослоп ( где чистый промпт, нет живого автора текста и в основе нет автора мелодии), который лежит мертвым грузом и его практически не слушают, или то примитивное дерьмо в чартах от кожаных, которое невозможно слушать нормальному человеку и которое говорит о деградации? И к этой деградации привел отнюдь не ИИ.

arthuru1 Jul 3 at 03:03

Тексты в основном настоящие, человек пишет текст и загружает в нейронку

nitro80 Jul 3 at 03:12

Мне понравилась одна песня, полез читать - штош, ИИ, но нравится же!

ProgerMan Jul 2 at 22:07

Справедливости ради, есть несколько ИИ-треков, которые мне нравятся. Но я бы предпочёл их не слышать ни в одной подборке, а только когда я сам руками их включаю.

AngusMetall Jul 3 at 01:34

Странно, что вы настолько разбираетесь в нейросетях, но не знаете, что на вашей картинке не checkerboard артефакты, а результат работы нейросети deepdream. Это обычная картинка поверх которой наложен слой того, что "распознаёт" на этой картинке нейросеть обученная распознавать собак.

alexeyfv Jul 3 at 06:52

Заменил картинку. Спасибо.

arthuru1 Jul 3 at 03:01

Тоже самое в ВК в рекомендациях почти одна генеренка, я уже научился на слух определять почти мгновенно, голос имеет характерные гармонические искажения и еще несколько признаков. Но бывают попадаются прям шедевры, главная беда что довольно однообразно

worldown Jul 3 at 06:50

А можно отнести к ИИ слопу музыку, в которой ИИ сыграла роль улучшителя качества. А исходный материал был создан человеком?

И разница между такими треками, только в том что музыка стала более завершенная и вкусная?

ALT0105 Jul 3 at 07:19

На предыдущем витке истории искусствоведы говорили, что пьесы Шекспира написал кто-то другой. Но читателю и зрителю - какая разница, как фамилия автора? Козьмы Пруткова тоже не было.

zumrus Jul 3 at 09:37

Любопытно. В вашей истории смущает только то, что вы не сильно соприкасаетесь или сравниваетесь с мировыми разработками в области детекции ИИ-музыки, если не считать статью с ISMIR 2025. По хорошему, ваш метод стоит прогнать через существующие бенчи, например,

https://arxiv.org/abs/2412.13421

https://huggingface.co/papers/2603.23667

Ну и свою статью стоит подать куда нибудь.

Успехов!

alexeyfv Jul 3 at 11:27

Ознакомлюсь. Спасибо.

kneaded Jul 3 at 18:41

Яндекс как всегда - ему важнее алгоритмы и структуры данных, а не забота о клиенте. Лавеха мутится, бабло крутится - остальное плевать

temonix Jul 3 at 19:01

Мы выпускаем музыку, берем аранжировку суны и пишем свой вокал. Почему так? Потому что суно делает аранжировку лучше среднего аранжировщика, а топовые берут столько, что денег не хватит. А ведь муз бизнес жесткий, никакой гарантии, что трек выстрелит. Это игра в долгую, надо годами выпускать, чтобы аудиторию наработать. А если за каждую песню отдавать 1к$ (западные берут в 2-3 раза больше), то деньги кончатся раньше чем накопишь хотя бы на концертную программу.

И "Шаде" это не нейрослоп, там вокал настоящий, только в припеве девушку суно оставили, а парни по-настоящему поют.

Мы смотрим на суно, как на новый инструмент, который позволяет более широкому кругу людей раскрыть свои таланты. На первый план выходит музыкальный вкус.

Как то так. Я конечно за свою честность ща отхвачу минусов, но тема для меня живая.

Для примера анализировал релизную пятницу за последние несколько лет, из 1300 артистов около 800 имело меньше 100 слушателей, медиана 86. Так что есть тысячи артистов, кто постоянно что то выпускает (с ии и без) которые так и не нашли своего слушателя. Некоторые из них возможно потому что нет возможности сделать хорошую аранжировку и маркетинг. Суно для них (нас) это соломинка к мечте.

k4ir05 Jul 4 at 01:55

И "Шаде" это не нейрослоп, там вокал настоящий, только в припеве девушку суно оставили, а парни по-настоящему поют.

По-вашему выходит, что бочка мёда с ложкой дёгтя всё ещё нормальная бочка мёда, да? А пение под фанеру - это живое выступление если остальные инструменты играют в живую?

Mishootk Jul 6 at 08:33

Это игра в долгую, надо годами выпускать, чтобы аудиторию наработать.

Выпускать что?

Я, слушатель, если слышу что-то средненькое, я пропускаю, блочу по возможности. Если тут алгоритмы, они мне больше не подсунут. Если я вижу обложку исполнителя, я его вычеркиваю из сознания.

Как выстрелишь, если каждый трек выпускается как с конвейера и похож на все предыдущие?

Mishootk Jul 6 at 08:32

del

WordEngineer Jul 8 at 05:33

Интересно, что в основе детектора лежат артефакты архитектуры, а не "стиля" ИИ-музыки. Транспонированные свёртки оставляют характерные паттерны в частотном спектре - примерно так же, как первые GAN-картинки имели заметный "шахматный" паттерн. И это одновременно и сильная, и слабая сторона метода.

Raaseqqe Jul 13 at 09:00

Ну ок. А представьте, что в процессе производства трека, ты используешь какой-нибудь плагин на Мастеринге, который тебе делает звуковую волну и пики так, что ИИ детектор думает, что ты использовал генерацию. Обтдненько..