alexeyfv2 июл в 05:47

Треть новых релизов на Яндекс Музыке – ИИ. Теперь точно

Простой

5 мин

25K

Машинное обучение * Искусственный интеллект

Аналитика

+73

Комментарии 79

yesus1707 2 июл в 07:46

еще одна причина отказаться от подписки яндекс плюс

ProgerMan 2 июл в 22:02

Я позавчера себе Spotify установил как раз из-за нейрослопа на Яндексе.

THEOILMAN 3 июл в 04:06

Там дела не сильно лучше. Держу его только потому, что знаю, что хочу послушать. Рекомендации так же в дерьме.

achekalin 3 июл в 05:50

Ну, значит, держат марку.

Я вот на днях включил "моб волну" в этом расфуфыпенном веб-интерфейсе, который жрёт почему-то, мой проц на отрисовку совсем ненужной мне (при прослушивании в фоне) анимации - и понял, что музыку он дает ровно из той, что я налайкал годы назад.

Те вроде не напрягает музыка, но - это же волна рекомендательного характера, по идее, а не просто "включи мой favorites"!

А что за контентом не следят уже с двух направлений (т.е. нормальный контент теряют, заменяя всякими перепевками - а теперь вот и ии поощряя заполнять пустоту) - блин, тот еще звоночек

Zelinoff 2 июл в 08:06

Лучше бы написали статью как от этого дерьма избавиться!

Пока вручную блокирую все, что не имеет релизов 2024 и раньше, но бесит😬

alexeyfv 2 июл в 08:14

Так я написал. Посмотрите предыдущую статью.

iv_an_chel 2 июл в 11:22

Подскажите, в вашем приложении можно помечать, но не блокировать/автоскипать ии-музыку? Просто есть некоторые ии-треки, которые мне нравятся, не хотелось бы их потерять

alexeyfv 2 июл в 11:29

Да, там есть режим "Ничего не делать"

Скрытый текст

yahooyaks 2 июл в 23:31

Если слушать разборчиво, то не бесит и блокировать нечего. Подписался на триал, залайкал всех понравившиеся исполнителей, скачал дискографии и слушай пол года.

nitro80 3 июл в 02:34

А вот не всё можно скачать, я не могу одного исполнителя скачать, как ни искал

yahooyaks 3 июл в 05:41

А у меня противоположный опыт. Сектор газа зацезурен, Pizzicato Five - жалкие крохи, детские песни - стремные перепевки, какие-то композиции отмечены как нэнедостуые, какие-то альбомы отсутствуют впринципе. Только качать и остаётся.

ALT0105 2 июл в 08:18

Два вопроса: 1. Если слушателю нравится музыка, какая разница кто ее написал? 2. Если мешают выбросы в спектре ИИ-шной музыки, что мешает удалить их прямо в спектре - просто срезать выступающие гармоники или пропустить спектр через медианный фильтр, который сделает это аккуратнее, и обратным преобразованием Фурье получить музыку, неотличимую от человеческой?

alexeyfv 2 июл в 08:23

Два ответа: 1. Я чужие вкусы и предпочтения не осуждаю. Нравится - пусть слушают. 2. Ничего не мешает, только зачем пытаться что-то скрывать?

НЛО прилетело и опубликовало эту надпись здесь

SolidSnack 3 июл в 01:14

Хорошее замечание кстати, музыка стала слишком простой, что даже ИИшница выглядит реалистично)

Andreas_Fogel 3 июл в 19:14

Вспомните музыку 90ых и 2000ых. Там как раз в топе была музыка из пары слов. Тогда бессловный Acid, Trance, Hip-hop, Eurodance, Rock, RAP. Текста там были примитивные в большей степени. Но музыку этих лет я слушаю чаще всего. Так как тогда сделать такое было желанием только сильных личностей.

ALT0105 2 июл в 08:50

Не скрывать, а убрать искажения, которых не должно быть в чистом звучании.

burstmode 2 июл в 08:51

На счёт второго пункта: у ИИ-шной музыки не только в частотном спектре проблема. В плане аранжировки (и это актуально для всех нейросетей, включая Suno и Udio) там нет:

контр-мелодии/второго ведущего элемента , не считая истинную контр-мелодию в виде call-and-respone
контр-ритма - т. е. ритмических элементов, которые играют "мимо" основного ритма драмки
конфет для ушей (ear candy в оригинале), по-простому коротких звуковых деталей, которые не заметны на первом прослушивании (т. к. на первом прослушиваний слушатель фокусируется на основном лиде, гармонии, ударках и басе), но делают трек интереснее при повторных прослушиваниях

То есть, если мы слышим второй лид, гармонизирующий основной лид или два равнозначных лида, или контр-ритм (условные хай-хэты с off-beat паттернами), или ear candy в левом ухе в виде звука подброшенной монеты - трек 100% не нейрослоповый.

Проблема в том, что у очень многих людей ненатренерованный слух (они просто не обращают на эти элементы внимание, даже если их уши в принципе фиксируют их наличие в треке), плюс большинство слушает на довольно дешёвом аудиооборудовании, и там эти элементы аранжировки слышно хуже, чем на более-менее нормальных ушах вроде условных Soundcore Space One.

Если что, всё что я выше расписал, это мои личные наблюдения, а не копипаста откуда-то. Просто я некоторое время увлекался продюсированием и аранжировкой, и для себя отметил вот эти нюансы, когда игрался с Suno пятой версии где-то пару месяцев назад.

UPD: перечитал свой коммент, вышло так, что он отвечает и на первый первый вопрос "какая разница, кто написал, если нравится". Разница как раз в продолжительности жизни песни.

Типичный нейрослоповый трек без контр-мелодий, контр-ритма и ear candy может понравиться с первого раза благодаря яркому припеву или знакомой гармонии. Но она быстро надоест. На 3-й и 5-й раз слушать её будет скучно, потому что там нет глубины — уху не за что зацепиться, кроме первого плана. Человеческая музыка "живет" долго именно за счет этих скрытых слоев аранжировки. Даже если вы их не замечаете, ваши уши всё равно фиксируют их наличие в треке.

ALT0105 2 июл в 09:01

Я когда-то читал, что есть такие любители музыки, которые не ходят на концерты, потому что дирижёр дает своё восприятие, а не доносит в чистом виде написанное композитором. Поэтому они просто читают ноты. Кстати, ИИ же может сделать нотную запись?

burstmode 2 июл в 09:34

Аналогия про дирижёра не в тему. Там спор про точность передачи чужого замысла: дирижёр интерпретирует, а не искажает. Я же говорю не про интерпретацию, а про физическое наличие или отсутствие определённых элементов в самой записи.

В отредактированном первом комментарии я уже упомянул, что эти элементы нужны для увеличения срока жизни песни, но это не единственная причина их добавления в трек. Есть довольно устойчивое наблюдение в психоакустике и звукорежиссуре: человеку не нравится стерильная цифровая тишина, и мозг лучше вовлекается в сигнал с лёгкой шумовой текстурой - отсюда фоновый шелест плёнки или розовый шум прямо в синтезаторе. Слушатель чаще всего не осознаёт эту деталь напрямую, а она всё равно влияет на то, нравится ему трек или нет. То же самое с контр-мелодией и ear candy - их не обязательно слышать, чтобы они делали своё дело.

По нотам - генераторы MIDI-последовательностей есть, но по факту это сырой черновик, а не готовое решение: библиотеки плохо оживляют такие партии, тайминг и артикуляцию всё равно приходится дотягивать руками.

piuzziconezz 2 июл в 11:23

Это просто любители нот

yahooyaks 3 июл в 06:11

Еженедельник "Музыкальная правда" читают.

nidalee 3 июл в 04:20

Мне не нравятся концерты просто потому, что звук хуже. В студии его вылизывали, а на концерте сыграли как сыграли.

ALT0105 3 июл в 04:59

А я помню как с удовольствием слушал в филармонии игру на рояле Андрея Петрова, а слушать такую музыку в записи дома или в машине - не слушаю.

k4ir05 3 июл в 05:57

В филармонии другой настрой, и музыка воспринимается иначе. Да и акустика решает.

iv_an_chel 3 июл в 08:29

Вы правы, академическую музыку лучше слушать вживую. Я после концерта пошёл и скачал все доступные записи Карла Орфа "O, fortuna!", но ни одна из них даже близко не передаёт того впечатления, что я получил вживую

zlobnayapomidorka 2 июл в 10:09

Мне кажется чем дальше, тем умнее станут музыкописные ИИ. Уже сейчас ИИ предлагает попробовать не 1-Click песню написать, а накидать ее в условном FL-Studio. Если ее соберут таким способом и еще дополнительно не поленятся прошерстить и исправить недочеты - то такие треки будет крайне трудно отличить от настоящих.

Что на счет аранжировки, тут все зависит имхо от скилла промптописателя. В моем топе находиться данная композиция, где на мой взгляд ваши пункты частично покрываются:

Я ни разу не музыкант, поэтому могу ошибаться (Сообщество было бы очень радо если бы вы смогли привести примеры к каждому вашему описанному пункту. Нам очень интересно услышать человека из индустрии!).

Child of Ash and Thorn (Ютуб)

Отдельно хочу подчеркнуть что хоть в моем рационе и есть ИИ музыка, я потребляю ее разумно. И категорически против массового захламления интернета нейрослопом - пусть от YouTube отпочковывается AiTube, и засоряют там харды гугла сколько душе им влезет.

k4ir05 3 июл в 06:28

Мне кажется чем дальше, тем умнее станут музыкописные ИИ.

Но они никогда не станут лучше среднего.

По поводу примера. Я не спец (могу путаться в терминах и каких-то нюансах), но он же сильно отличается от живого симфо-метала. Слишком скудная мелодия. Ударная партия странная, тарелок, по-моему, вообще нет (местами есть какая-то имитация, но больше на шум похоже). Такое ощущение, что акцент делается только на вокал и одну из инструментальных партий. Играют ударные, потом вступает "гитара" - и ударные почти пропадают. Потом опять оживают ударные, но остальные "гитару" стихает и превращается в шум. Вибрато в вокале неестественные (на 50:44 особенно заметно), обертонов как будто вообще нет (стерильный голос), монотонный (меняется только высота, но нет акцентов и интонаций). Да и вообще голос похож на голоса в других ИИ-шных песен, нет уникальности.

vadimk91 2 июл в 11:45

Я подписан на одно сообщество, где регулярно выкладывают альбомы разных стилей. Так вот, то что называется Easy listening - по-моему нейрослопа там уже больше половины существенно, настолько эти треки однообразные и "одноразовые".

А еще я слушая музыку через не совсем дешевые колонки, вдруг поймал себя на мысли что нынешние записи почти перестали быть стерео, когда обращаешь внимание, что источник звука где-то локализован. Да и в звуковом редакторе открываешь трек, а картинка левого и правого канала практически одинакова.

ALT0105 3 июл в 08:37

Всё можно сделать, и объемное видео, и объемный звук, но это лишние затраты. Как сейчас модно говорить "А зачем?", ведь как говорили раньше - "Пипл хавает".

jakobz 2 июл в 21:26

Я генерировал прилично всякого через suno и прочие. Нормально оно умеет всякое. Что-то плоховато, например не может насыпать готовых семплов для атмосферки. И если специально не просить сделать гармонию сложнее - генерит примитивное. Но если попросишь - полиритмы, контр-мелодии, микро-тональность - всё будет. Если там покрутить промпт, а еще и в DAW потом поработать - там можно пилить вещи, которые и ценитель не поймет что это AI.

Другое дело, когда просто в один присест промптом генерят «сделай реп чтобы топ в чарте» - там да, выходит нейрослоп лютый. Особенно, как ни странно, выдают тексты. Почему-то стихи выше среднего llm пока не могут.

Сходи в suno, попробуй всякое типа «microtonal polyrhythm, non-trivial harmony, post-rock”. Или просто «Bach-like classical”, вот например:

https://suno.com/song/ef59d683-60a2-497f-978c-7d28bcf06255

Нисколько не хочу приукрасить, и оправдать нейрослоп. Но оно, правда, умеет так, что офигеть.

nixtonixto 3 июл в 03:06

трек без контр-мелодий, контр-ритма и ear candy может понравиться с первого раза благодаря яркому припеву или знакомой гармонии. Но она быстро надоест. На 3-й и 5-й раз слушать её будет скучно, потому что там нет глубины — уху не за что зацепиться, кроме первого плана. Человеческая музыка "живет" долго именно за счет этих скрытых слоев аранжировки.

Следуя вашей логике - музыка Сектора Газа, Ласкового мая и др. должна была потерять привлекательность после пятого прослушивания. Как вы прокомментируете то, что её слушают до сих пор?

nidalee 3 июл в 04:21

За душу берет :)

k4ir05 3 июл в 06:37

Текста тащат) А ещё бывают нескучающие слушатели.

Fedorkov 3 июл в 05:53

А я в первый раз отличил сгенерированную музыку по банальному тексту песни. Это был блюз типа такого.

k4ir05 3 июл в 05:50

Если слушателю нравится музыка, какая разница кто ее написал?

Если писал человек, то с большой вероятностью и другие его песни понравятся, поэтому можно на него подписаться и смело изучать всю дискографию.

ALT0105 3 июл в 05:55

А почему с ИИ вероятность не та?

yahooyaks 3 июл в 06:20

Скорее всего, ИИшные треки не композиторы пилят, а автогенерация. Похоже на музыку? - давай в народ! Нет ни идеи, ни последовательности, ни приемственности.

ALT0105 3 июл в 06:25

А попсу (и музыку, и слова) люди пишут по-другому?

k4ir05 3 июл в 06:45

Над хорошей попсой всё же сильно стараются. И исполнитель, который хочет отличаться от остальных и быть успешным, обычно придерживается определённого стиля и качества.

ALT0105 3 июл в 06:49

Конечно, у каждого свой стиль. ИИ тоже делает в заданном стиле. И я думаю, ИИ-шная поп-музыка скоро легко обойдет человеческую и найдет своего слушателя. Но не меня.

k4ir05 3 июл в 06:41

Не могу сказать - у меня по ним статистика пока нулевая. Ещё ни одна ИИ-шная песня не понравилась.

ALT0105 3 июл в 06:44

Попса ничем не лучше и я не замечаю разницы. Было бы интересно послушать ИИ в стиле Beatles.

k4ir05 3 июл в 06:48

В массе своей - да, потому я её слушаю крайне избирательно. Хорошая иногда встречается.

iv_an_chel 3 июл в 08:34

Можно зайти в ЯМ на страничку любого ии-исполнителя и увидеть, что стреляет одна-две песни, остальное прямо сильно слабее

Pythonpy 2 июл в 08:58

Отличная статья! К сожалению это уже наша реальность. Фильтр ИИ был бы полезен. Зная как работает яндекс, могут маркировать ИИ и продавать отдельно.

iv_an_chel 3 июл в 08:37

На самом деле надо просто понизить роялти для ии-музыки, чтобы было справедливое распределение между музыкантами, которые тратили на создание своей музыки время, усилия и деньги, и нейрослопщиками, которые тупо отгребают кассу

piton-vas 4 июл в 12:43

Тогда появится дополнительная денежная мотивация обхода фильтров.

Q3_Results 2 июл в 11:44

Осталось совсем чуть-чуть до Вашего создания сервиса по определению нейромузыки на Яндексе - ничто не мешает Вам запустить сайт с таким сервисом. Заодно и посмотрите, насколько на самом деле слушателям важно отличать истинную музыку от ИИ.

И второй момент - сэмплы и звуковые эффекты композиторы могут создавать так же с помощью ИИ, и может получиться так, что композитор сочинял свою музыку, а в итоге его обвиняют в том, что его музыка сгенерирована. Как точно разделять эту грань творчества?

alexeyfv 2 июл в 12:16

Заодно и посмотрите, насколько на самом деле слушателям важно отличать истинную музыку от ИИ.

Расширение уже больше месяца существует. Сейчас WAU примерно 1000 человек.

Как точно разделять эту грань творчества?

Сервисы сами будут решать, судя по всему. Где-то будут разрешать музыку, где-то будут маркировать и демонетизировать. Deezer и Tidal вот маркируют и демонетизируют.

Mishootk 2 июл в 14:48

После того как я поинтересовался одним исполнителем и прочитал, что он честно признается в том, что с помощью ИИ создает музыку и вокал, я стал замечать искусственные голоса и у других исполнителей. И вдруг все исполнение резко разделилось на голоса которые мне перестали нравиться и на нормальные песни.

В рамках данной статьи и обсуждения я так и не уловил до конца, обсуждается только музыка, или вокал тоже? Меня больше искусственный вокал напрягает. Как будто бы я в своей девушке вдруг разглядел резиновую бабу...

alexeyfv 2 июл в 18:33

Я не делал разделения между только музыкой и вокалом. Анализировал все треки целиком.

Dartflame 2 июл в 14:57

Новую музыку вообще не нужно слушать, только свежие релизы от проверенных временем музыкантов. А вообще у меня на плеере скачана коллекция рока от 60ых до нашего времени, в основном это 70ые и 80ые, там не было никакого ИИ и этого более чем достаточно, чтоб закрыть музыкальные потребности.

ИИ это худшее, что было с человечеством, но пути назад уже нет.

nitro80 3 июл в 03:11

Новую музыку вообще не нужно слушать

Ok, расскажите теперь нам, что же слушать?

yahooyaks 3 июл в 06:33

Слушайте Annie Lennox

anwender95 6 июл в 08:11

Я опять старье слушаю)
У Depeche Mode и Judas Priest есть куча клевых песен.

nitro80 6 июл в 08:47

Наверняка старые волосатые наркоманы в трико?

bomitau 3 июл в 04:04

Сейчас мало кто скачивает, многие просто не знают и не умеют, даже не слышали про рутрекер и то, что можно скачать дискографию или сериал целиком.

iv_an_chel 3 июл в 08:39

Ну это какая-то старперская позиция. Я, например, устал от старого рок-репертуара и постоянно ищу что-то новенькое (и нахожу)

V8-350 4 июл в 06:56

«О дивный новый мир.»

Ну, нам, пожилым, старой музыки (будь то рок или электроника) на наш век хватит. Скаченные коллекции альбомов, самодельные сборники «микс тейпы» всегда с собой. На «облака» и «стриминги» не рассчитывал никогда.

В конце концов, если хочется чего-то новенькое, всегда можно послушать инструментальную музыку на выступлениях, даже в записи (с электроникой сложнее).

А молодёжь сама определится, что ей больше нравится. Со временем-то уж точно.

eggor 2 июл в 18:32

Может и так, но качество релизов от этого не меняется. А жаль

alefiro 2 июл в 20:52

Вот я думаю - что хуже? Убогий голый нейрослоп ( где чистый промпт, нет живого автора текста и в основе нет автора мелодии), который лежит мертвым грузом и его практически не слушают, или то примитивное дерьмо в чартах от кожаных, которое невозможно слушать нормальному человеку и которое говорит о деградации? И к этой деградации привел отнюдь не ИИ.

arthuru1 3 июл в 03:03

Тексты в основном настоящие, человек пишет текст и загружает в нейронку

nitro80 3 июл в 03:12

Мне понравилась одна песня, полез читать - штош, ИИ, но нравится же!

ProgerMan 2 июл в 22:07

Справедливости ради, есть несколько ИИ-треков, которые мне нравятся. Но я бы предпочёл их не слышать ни в одной подборке, а только когда я сам руками их включаю.

AngusMetall 3 июл в 01:34

Странно, что вы настолько разбираетесь в нейросетях, но не знаете, что на вашей картинке не checkerboard артефакты, а результат работы нейросети deepdream. Это обычная картинка поверх которой наложен слой того, что "распознаёт" на этой картинке нейросеть обученная распознавать собак.

alexeyfv 3 июл в 06:52

Заменил картинку. Спасибо.

arthuru1 3 июл в 03:01

Тоже самое в ВК в рекомендациях почти одна генеренка, я уже научился на слух определять почти мгновенно, голос имеет характерные гармонические искажения и еще несколько признаков. Но бывают попадаются прям шедевры, главная беда что довольно однообразно

worldown 3 июл в 06:50

А можно отнести к ИИ слопу музыку, в которой ИИ сыграла роль улучшителя качества. А исходный материал был создан человеком?

И разница между такими треками, только в том что музыка стала более завершенная и вкусная?

ALT0105 3 июл в 07:19

На предыдущем витке истории искусствоведы говорили, что пьесы Шекспира написал кто-то другой. Но читателю и зрителю - какая разница, как фамилия автора? Козьмы Пруткова тоже не было.

zumrus 3 июл в 09:37

Любопытно. В вашей истории смущает только то, что вы не сильно соприкасаетесь или сравниваетесь с мировыми разработками в области детекции ИИ-музыки, если не считать статью с ISMIR 2025. По хорошему, ваш метод стоит прогнать через существующие бенчи, например,

https://arxiv.org/abs/2412.13421

https://huggingface.co/papers/2603.23667

Ну и свою статью стоит подать куда нибудь.

Успехов!

alexeyfv 3 июл в 11:27

Ознакомлюсь. Спасибо.

kneaded 3 июл в 18:41

Яндекс как всегда - ему важнее алгоритмы и структуры данных, а не забота о клиенте. Лавеха мутится, бабло крутится - остальное плевать

temonix 3 июл в 19:01

Мы выпускаем музыку, берем аранжировку суны и пишем свой вокал. Почему так? Потому что суно делает аранжировку лучше среднего аранжировщика, а топовые берут столько, что денег не хватит. А ведь муз бизнес жесткий, никакой гарантии, что трек выстрелит. Это игра в долгую, надо годами выпускать, чтобы аудиторию наработать. А если за каждую песню отдавать 1к$ (западные берут в 2-3 раза больше), то деньги кончатся раньше чем накопишь хотя бы на концертную программу.

И "Шаде" это не нейрослоп, там вокал настоящий, только в припеве девушку суно оставили, а парни по-настоящему поют.

Мы смотрим на суно, как на новый инструмент, который позволяет более широкому кругу людей раскрыть свои таланты. На первый план выходит музыкальный вкус.

Как то так. Я конечно за свою честность ща отхвачу минусов, но тема для меня живая.

Для примера анализировал релизную пятницу за последние несколько лет, из 1300 артистов около 800 имело меньше 100 слушателей, медиана 86. Так что есть тысячи артистов, кто постоянно что то выпускает (с ии и без) которые так и не нашли своего слушателя. Некоторые из них возможно потому что нет возможности сделать хорошую аранжировку и маркетинг. Суно для них (нас) это соломинка к мечте.

k4ir05 4 июл в 01:55

И "Шаде" это не нейрослоп, там вокал настоящий, только в припеве девушку суно оставили, а парни по-настоящему поют.

По-вашему выходит, что бочка мёда с ложкой дёгтя всё ещё нормальная бочка мёда, да? А пение под фанеру - это живое выступление если остальные инструменты играют в живую?

Mishootk 6 июл в 08:33

Это игра в долгую, надо годами выпускать, чтобы аудиторию наработать.

Выпускать что?

Я, слушатель, если слышу что-то средненькое, я пропускаю, блочу по возможности. Если тут алгоритмы, они мне больше не подсунут. Если я вижу обложку исполнителя, я его вычеркиваю из сознания.

Как выстрелишь, если каждый трек выпускается как с конвейера и похож на все предыдущие?

Mishootk 6 июл в 08:32

del

WordEngineer 8 июл в 05:33

Интересно, что в основе детектора лежат артефакты архитектуры, а не "стиля" ИИ-музыки. Транспонированные свёртки оставляют характерные паттерны в частотном спектре - примерно так же, как первые GAN-картинки имели заметный "шахматный" паттерн. И это одновременно и сильная, и слабая сторона метода.

Raaseqqe 13 июл в 09:00

Ну ок. А представьте, что в процессе производства трека, ты используешь какой-нибудь плагин на Мастеринге, который тебе делает звуковую волну и пики так, что ИИ детектор думает, что ты использовал генерацию. Обтдненько..

Зарегистрируйтесь на Хабре, чтобы оставить комментарий