Pull to refresh

Comments 73

еще одна причина отказаться от подписки яндекс плюс

Я позавчера себе Spotify установил как раз из-за нейрослопа на Яндексе.

Там дела не сильно лучше. Держу его только потому, что знаю, что хочу послушать. Рекомендации так же в дерьме.

Ну, значит, держат марку.

Я вот на днях включил "моб волну" в этом расфуфыпенном веб-интерфейсе, который жрёт почему-то, мой проц на отрисовку совсем ненужной мне (при прослушивании в фоне) анимации - и понял, что музыку он дает ровно из той, что я налайкал годы назад.

Те вроде не напрягает музыка, но - это же волна рекомендательного характера, по идее, а не просто "включи мой favorites"!

А что за контентом не следят уже с двух направлений (т.е. нормальный контент теряют, заменяя всякими перепевками - а теперь вот и ии поощряя заполнять пустоту) - блин, тот еще звоночек

Лучше бы написали статью как от этого дерьма избавиться!

Пока вручную блокирую все, что не имеет релизов 2024 и раньше, но бесит😬

Так я написал. Посмотрите предыдущую статью.

Подскажите, в вашем приложении можно помечать, но не блокировать/автоскипать ии-музыку? Просто есть некоторые ии-треки, которые мне нравятся, не хотелось бы их потерять

Если слушать разборчиво, то не бесит и блокировать нечего. Подписался на триал, залайкал всех понравившиеся исполнителей, скачал дискографии и слушай пол года.

А вот не всё можно скачать, я не могу одного исполнителя скачать, как ни искал

А у меня противоположный опыт. Сектор газа зацезурен, Pizzicato Five - жалкие крохи, детские песни - стремные перепевки, какие-то композиции отмечены как нэнедостуые, какие-то альбомы отсутствуют впринципе. Только качать и остаётся.

Два вопроса: 1. Если слушателю нравится музыка, какая разница кто ее написал? 2. Если мешают выбросы в спектре ИИ-шной музыки, что мешает удалить их прямо в спектре - просто срезать выступающие гармоники или пропустить спектр через медианный фильтр, который сделает это аккуратнее, и обратным преобразованием Фурье получить музыку, неотличимую от человеческой?

Два ответа: 1. Я чужие вкусы и предпочтения не осуждаю. Нравится - пусть слушают. 2. Ничего не мешает, только зачем пытаться что-то скрывать?

Как видим текста за последние 10 лет упростили до того что в песне может быть всего пара повторяющихся слов, разнообразие урезали, вокал заменили на фанеру, а в музыке оставили элементы наиболее возбуждающе наш мозг. После такого естественно нейромузыка способна заменить реальность, к сожалению 

Хорошее замечание кстати, музыка стала слишком простой, что даже ИИшница выглядит реалистично)

Вспомните музыку 90ых и 2000ых. Там как раз в топе была музыка из пары слов. Тогда бессловный Acid, Trance, Hip-hop, Eurodance, Rock, RAP. Текста там были примитивные в большей степени. Но музыку этих лет я слушаю чаще всего. Так как тогда сделать такое было желанием только сильных личностей.

Не скрывать, а убрать искажения, которых не должно быть в чистом звучании.

На счёт второго пункта: у ИИ-шной музыки не только в частотном спектре проблема. В плане аранжировки (и это актуально для всех нейросетей, включая Suno и Udio) там нет:

  1. контр-мелодии/второго ведущего элемента , не считая истинную контр-мелодию в виде call-and-respone

  2. контр-ритма - т. е. ритмических элементов, которые играют "мимо" основного ритма драмки

  3. конфет для ушей (ear candy в оригинале), по-простому коротких звуковых деталей, которые не заметны на первом прослушивании (т. к. на первом прослушиваний слушатель фокусируется на основном лиде, гармонии, ударках и басе), но делают трек интереснее при повторных прослушиваниях

То есть, если мы слышим второй лид, гармонизирующий основной лид или два равнозначных лида, или контр-ритм (условные хай-хэты с off-beat паттернами), или ear candy в левом ухе в виде звука подброшенной монеты - трек 100% не нейрослоповый.

Проблема в том, что у очень многих людей ненатренерованный слух (они просто не обращают на эти элементы внимание, даже если их уши в принципе фиксируют их наличие в треке), плюс большинство слушает на довольно дешёвом аудиооборудовании, и там эти элементы аранжировки слышно хуже, чем на более-менее нормальных ушах вроде условных Soundcore Space One.

Если что, всё что я выше расписал, это мои личные наблюдения, а не копипаста откуда-то. Просто я некоторое время увлекался продюсированием и аранжировкой, и для себя отметил вот эти нюансы, когда игрался с Suno пятой версии где-то пару месяцев назад.

UPD: перечитал свой коммент, вышло так, что он отвечает и на первый первый вопрос "какая разница, кто написал, если нравится". Разница как раз в продолжительности жизни песни.

Типичный нейрослоповый трек без контр-мелодий, контр-ритма и ear candy может понравиться с первого раза благодаря яркому припеву или знакомой гармонии. Но она быстро надоест. На 3-й и 5-й раз слушать её будет скучно, потому что там нет глубины — уху не за что зацепиться, кроме первого плана. Человеческая музыка "живет" долго именно за счет этих скрытых слоев аранжировки. Даже если вы их не замечаете, ваши уши всё равно фиксируют их наличие в треке.

Я когда-то читал, что есть такие любители музыки, которые не ходят на концерты, потому что дирижёр дает своё восприятие, а не доносит в чистом виде написанное композитором. Поэтому они просто читают ноты. Кстати, ИИ же может сделать нотную запись?

Аналогия про дирижёра не в тему. Там спор про точность передачи чужого замысла: дирижёр интерпретирует, а не искажает. Я же говорю не про интерпретацию, а про физическое наличие или отсутствие определённых элементов в самой записи.

В отредактированном первом комментарии я уже упомянул, что эти элементы нужны для увеличения срока жизни песни, но это не единственная причина их добавления в трек. Есть довольно устойчивое наблюдение в психоакустике и звукорежиссуре: человеку не нравится стерильная цифровая тишина, и мозг лучше вовлекается в сигнал с лёгкой шумовой текстурой - отсюда фоновый шелест плёнки или розовый шум прямо в синтезаторе. Слушатель чаще всего не осознаёт эту деталь напрямую, а она всё равно влияет на то, нравится ему трек или нет. То же самое с контр-мелодией и ear candy - их не обязательно слышать, чтобы они делали своё дело.

По нотам - генераторы MIDI-последовательностей есть, но по факту это сырой черновик, а не готовое решение: библиотеки плохо оживляют такие партии, тайминг и артикуляцию всё равно приходится дотягивать руками.

Это просто любители нот

Еженедельник "Музыкальная правда" читают.

Мне не нравятся концерты просто потому, что звук хуже. В студии его вылизывали, а на концерте сыграли как сыграли.

А я помню как с удовольствием слушал в филармонии игру на рояле Андрея Петрова, а слушать такую музыку в записи дома или в машине - не слушаю.

В филармонии другой настрой, и музыка воспринимается иначе. Да и акустика решает.

Вы правы, академическую музыку лучше слушать вживую. Я после концерта пошёл и скачал все доступные записи Карла Орфа "O, fortuna!", но ни одна из них даже близко не передаёт того впечатления, что я получил вживую

Мне кажется чем дальше, тем умнее станут музыкописные ИИ. Уже сейчас ИИ предлагает попробовать не 1-Click песню написать, а накидать ее в условном FL-Studio. Если ее соберут таким способом и еще дополнительно не поленятся прошерстить и исправить недочеты - то такие треки будет крайне трудно отличить от настоящих.

Что на счет аранжировки, тут все зависит имхо от скилла промптописателя. В моем топе находиться данная композиция, где на мой взгляд ваши пункты частично покрываются:

Я ни разу не музыкант, поэтому могу ошибаться (Сообщество было бы очень радо если бы вы смогли привести примеры к каждому вашему описанному пункту. Нам очень интересно услышать человека из индустрии!).

Child of Ash and Thorn (Ютуб)

Отдельно хочу подчеркнуть что хоть в моем рационе и есть ИИ музыка, я потребляю ее разумно. И категорически против массового захламления интернета нейрослопом - пусть от YouTube отпочковывается AiTube, и засоряют там харды гугла сколько душе им влезет.

Мне кажется чем дальше, тем умнее станут музыкописные ИИ.

Но они никогда не станут лучше среднего.

По поводу примера. Я не спец (могу путаться в терминах и каких-то нюансах), но он же сильно отличается от живого симфо-метала. Слишком скудная мелодия. Ударная партия странная, тарелок, по-моему, вообще нет (местами есть какая-то имитация, но больше на шум похоже). Такое ощущение, что акцент делается только на вокал и одну из инструментальных партий. Играют ударные, потом вступает "гитара" - и ударные почти пропадают. Потом опять оживают ударные, но остальные "гитару" стихает и превращается в шум. Вибрато в вокале неестественные (на 50:44 особенно заметно), обертонов как будто вообще нет (стерильный голос), монотонный (меняется только высота, но нет акцентов и интонаций). Да и вообще голос похож на голоса в других ИИ-шных песен, нет уникальности.

Я подписан на одно сообщество, где регулярно выкладывают альбомы разных стилей. Так вот, то что называется Easy listening - по-моему нейрослопа там уже больше половины существенно, настолько эти треки однообразные и "одноразовые".

А еще я слушая музыку через не совсем дешевые колонки, вдруг поймал себя на мысли что нынешние записи почти перестали быть стерео, когда обращаешь внимание, что источник звука где-то локализован. Да и в звуковом редакторе открываешь трек, а картинка левого и правого канала практически одинакова.

Всё можно сделать, и объемное видео, и объемный звук, но это лишние затраты. Как сейчас модно говорить "А зачем?", ведь как говорили раньше - "Пипл хавает".

Я генерировал прилично всякого через suno и прочие. Нормально оно умеет всякое. Что-то плоховато, например не может насыпать готовых семплов для атмосферки. И если специально не просить сделать гармонию сложнее - генерит примитивное. Но если попросишь - полиритмы, контр-мелодии, микро-тональность - всё будет. Если там покрутить промпт, а еще и в DAW потом поработать - там можно пилить вещи, которые и ценитель не поймет что это AI.

Другое дело, когда просто в один присест промптом генерят «сделай реп чтобы топ в чарте» - там да, выходит нейрослоп лютый. Особенно, как ни странно, выдают тексты. Почему-то стихи выше среднего llm пока не могут.

Сходи в suno, попробуй всякое типа «microtonal polyrhythm, non-trivial harmony, post-rock”. Или просто «Bach-like classical”, вот например:

https://suno.com/song/ef59d683-60a2-497f-978c-7d28bcf06255

Нисколько не хочу приукрасить, и оправдать нейрослоп. Но оно, правда, умеет так, что офигеть.

трек без контр-мелодий, контр-ритма и ear candy может понравиться с первого раза благодаря яркому припеву или знакомой гармонии. Но она быстро надоест. На 3-й и 5-й раз слушать её будет скучно, потому что там нет глубины — уху не за что зацепиться, кроме первого плана. Человеческая музыка "живет" долго именно за счет этих скрытых слоев аранжировки.

Следуя вашей логике - музыка Сектора Газа, Ласкового мая и др. должна была потерять привлекательность после пятого прослушивания. Как вы прокомментируете то, что её слушают до сих пор?

За душу берет :)

Текста тащат) А ещё бывают нескучающие слушатели.

А я в первый раз отличил сгенерированную музыку по банальному тексту песни. Это был блюз типа такого.

Если слушателю нравится музыка, какая разница кто ее написал?

Если писал человек, то с большой вероятностью и другие его песни понравятся, поэтому можно на него подписаться и смело изучать всю дискографию.

А почему с ИИ вероятность не та?

Скорее всего, ИИшные треки не композиторы пилят, а автогенерация. Похоже на музыку? - давай в народ! Нет ни идеи, ни последовательности, ни приемственности.

А попсу (и музыку, и слова) люди пишут по-другому?

Над хорошей попсой всё же сильно стараются. И исполнитель, который хочет отличаться от остальных и быть успешным, обычно придерживается определённого стиля и качества.

Конечно, у каждого свой стиль. ИИ тоже делает в заданном стиле. И я думаю, ИИ-шная поп-музыка скоро легко обойдет человеческую и найдет своего слушателя. Но не меня.

Не могу сказать - у меня по ним статистика пока нулевая. Ещё ни одна ИИ-шная песня не понравилась.

Попса ничем не лучше и я не замечаю разницы. Было бы интересно послушать ИИ в стиле Beatles.

В массе своей - да, потому я её слушаю крайне избирательно. Хорошая иногда встречается.

Можно зайти в ЯМ на страничку любого ии-исполнителя и увидеть, что стреляет одна-две песни, остальное прямо сильно слабее

Отличная статья! К сожалению это уже наша реальность. Фильтр ИИ был бы полезен. Зная как работает яндекс, могут маркировать ИИ и продавать отдельно.

На самом деле надо просто понизить роялти для ии-музыки, чтобы было справедливое распределение между музыкантами, которые тратили на создание своей музыки время, усилия и деньги, и нейрослопщиками, которые тупо отгребают кассу

Тогда появится дополнительная денежная мотивация обхода фильтров.

Осталось совсем чуть-чуть до Вашего создания сервиса по определению нейромузыки на Яндексе - ничто не мешает Вам запустить сайт с таким сервисом. Заодно и посмотрите, насколько на самом деле слушателям важно отличать истинную музыку от ИИ.

И второй момент - сэмплы и звуковые эффекты композиторы могут создавать так же с помощью ИИ, и может получиться так, что композитор сочинял свою музыку, а в итоге его обвиняют в том, что его музыка сгенерирована. Как точно разделять эту грань творчества?

Заодно и посмотрите, насколько на самом деле слушателям важно отличать истинную музыку от ИИ.

Расширение уже больше месяца существует. Сейчас WAU примерно 1000 человек.

Как точно разделять эту грань творчества?

Сервисы сами будут решать, судя по всему. Где-то будут разрешать музыку, где-то будут маркировать и демонетизировать. Deezer и Tidal вот маркируют и демонетизируют.

После того как я поинтересовался одним исполнителем и прочитал, что он честно признается в том, что с помощью ИИ создает музыку и вокал, я стал замечать искусственные голоса и у других исполнителей. И вдруг все исполнение резко разделилось на голоса которые мне перестали нравиться и на нормальные песни.

В рамках данной статьи и обсуждения я так и не уловил до конца, обсуждается только музыка, или вокал тоже? Меня больше искусственный вокал напрягает. Как будто бы я в своей девушке вдруг разглядел резиновую бабу...

Я не делал разделения между только музыкой и вокалом. Анализировал все треки целиком.

Новую музыку вообще не нужно слушать, только свежие релизы от проверенных временем музыкантов. А вообще у меня на плеере скачана коллекция рока от 60ых до нашего времени, в основном это 70ые и 80ые, там не было никакого ИИ и этого более чем достаточно, чтоб закрыть музыкальные потребности.

ИИ это худшее, что было с человечеством, но пути назад уже нет.

Новую музыку вообще не нужно слушать

Ok, расскажите теперь нам, что же слушать?

Слушайте Annie Lennox

Сейчас мало кто скачивает, многие просто не знают и не умеют, даже не слышали про рутрекер и то, что можно скачать дискографию или сериал целиком.

Ну это какая-то старперская позиция. Я, например, устал от старого рок-репертуара и постоянно ищу что-то новенькое (и нахожу)

«О дивный новый мир.»

Ну, нам, пожилым, старой музыки (будь то рок или электроника) на наш век хватит. Скаченные коллекции альбомов, самодельные сборники «микс тейпы» всегда с собой. На «облака» и «стриминги» не рассчитывал никогда.

В конце концов, если хочется чего-то новенькое, всегда можно послушать инструментальную музыку на выступлениях, даже в записи (с электроникой сложнее).

А молодёжь сама определится, что ей больше нравится. Со временем-то уж точно.

Может и так, но качество релизов от этого не меняется. А жаль

Вот я думаю - что хуже? Убогий голый нейрослоп ( где чистый промпт, нет живого автора текста и в основе нет автора мелодии), который лежит мертвым грузом и его практически не слушают, или то примитивное дерьмо в чартах от кожаных, которое невозможно слушать нормальному человеку и которое говорит о деградации? И к этой деградации привел отнюдь не ИИ.

Тексты в основном настоящие, человек пишет текст и загружает в нейронку

Мне понравилась одна песня, полез читать - штош, ИИ, но нравится же!

Справедливости ради, есть несколько ИИ-треков, которые мне нравятся. Но я бы предпочёл их не слышать ни в одной подборке, а только когда я сам руками их включаю.

Странно, что вы настолько разбираетесь в нейросетях, но не знаете, что на вашей картинке не checkerboard артефакты, а результат работы нейросети deepdream. Это обычная картинка поверх которой наложен слой того, что "распознаёт" на этой картинке нейросеть обученная распознавать собак.

Заменил картинку. Спасибо.

Тоже самое в ВК в рекомендациях почти одна генеренка, я уже научился на слух определять почти мгновенно, голос имеет характерные гармонические искажения и еще несколько признаков. Но бывают попадаются прям шедевры, главная беда что довольно однообразно

А можно отнести к ИИ слопу музыку, в которой ИИ сыграла роль улучшителя качества. А исходный материал был создан человеком?

И разница между такими треками, только в том что музыка стала более завершенная и вкусная?

На предыдущем витке истории искусствоведы говорили, что пьесы Шекспира написал кто-то другой. Но читателю и зрителю - какая разница, как фамилия автора? Козьмы Пруткова тоже не было.

Любопытно. В вашей истории смущает только то, что вы не сильно соприкасаетесь или сравниваетесь с мировыми разработками в области детекции ИИ-музыки, если не считать статью с ISMIR 2025. По хорошему, ваш метод стоит прогнать через существующие бенчи, например,

https://arxiv.org/abs/2412.13421

https://huggingface.co/papers/2603.23667

Ну и свою статью стоит подать куда нибудь.

Успехов!

Ознакомлюсь. Спасибо.

Яндекс как всегда - ему важнее алгоритмы и структуры данных, а не забота о клиенте. Лавеха мутится, бабло крутится - остальное плевать

Мы выпускаем музыку, берем аранжировку суны и пишем свой вокал. Почему так? Потому что суно делает аранжировку лучше среднего аранжировщика, а топовые берут столько, что денег не хватит. А ведь муз бизнес жесткий, никакой гарантии, что трек выстрелит. Это игра в долгую, надо годами выпускать, чтобы аудиторию наработать. А если за каждую песню отдавать 1к$ (западные берут в 2-3 раза больше), то деньги кончатся раньше чем накопишь хотя бы на концертную программу.

И "Шаде" это не нейрослоп, там вокал настоящий, только в припеве девушку суно оставили, а парни по-настоящему поют.

Мы смотрим на суно, как на новый инструмент, который позволяет более широкому кругу людей раскрыть свои таланты. На первый план выходит музыкальный вкус.

Как то так. Я конечно за свою честность ща отхвачу минусов, но тема для меня живая.

Для примера анализировал релизную пятницу за последние несколько лет, из 1300 артистов около 800 имело меньше 100 слушателей, медиана 86. Так что есть тысячи артистов, кто постоянно что то выпускает (с ии и без) которые так и не нашли своего слушателя. Некоторые из них возможно потому что нет возможности сделать хорошую аранжировку и маркетинг. Суно для них (нас) это соломинка к мечте.

И "Шаде" это не нейрослоп, там вокал настоящий, только в припеве девушку суно оставили, а парни по-настоящему поют.

По-вашему выходит, что бочка мёда с ложкой дёгтя всё ещё нормальная бочка мёда, да? А пение под фанеру - это живое выступление если остальные инструменты играют в живую?

Sign up to leave a comment.

Articles