Комментарии 30
еще одна причина отказаться от подписки яндекс плюс
Лучше бы написали статью как от этого дерьма избавиться!
Пока вручную блокирую все, что не имеет релизов 2024 и раньше, но бесит😬
Так я написал. Посмотрите предыдущую статью.
Если слушать разборчиво, то не бесит и блокировать нечего. Подписался на триал, залайкал всех понравившиеся исполнителей, скачал дискографии и слушай пол года.
Два вопроса: 1. Если слушателю нравится музыка, какая разница кто ее написал? 2. Если мешают выбросы в спектре ИИ-шной музыки, что мешает удалить их прямо в спектре - просто срезать выступающие гармоники или пропустить спектр через медианный фильтр, который сделает это аккуратнее, и обратным преобразованием Фурье получить музыку, неотличимую от человеческой?
Два ответа: 1. Я чужие вкусы и предпочтения не осуждаю. Нравится - пусть слушают. 2. Ничего не мешает, только зачем пытаться что-то скрывать?
Как видим текста за последние 10 лет упростили до того что в песне может быть всего пара повторяющихся слов, разнообразие урезали, вокал заменили на фанеру, а в музыке оставили элементы наиболее возбуждающе наш мозг. После такого естественно нейромузыка способна заменить реальность, к сожалению
Не скрывать, а убрать искажения, которых не должно быть в чистом звучании.
На счёт второго пункта: у ИИ-шной музыки не только в частотном спектре проблема. В плане аранжировки (и это актуально для всех нейросетей, включая Suno и Udio) там нет:
контр-мелодии/второго ведущего элемента , не считая истинную контр-мелодию в виде call-and-respone
контр-ритма - т. е. ритмических элементов, которые играют "мимо" основного ритма драмки
конфет для ушей (ear candy в оригинале), по-простому коротких звуковых деталей, которые не заметны на первом прослушивании (т. к. на первом прослушиваний слушатель фокусируется на основном лиде, гармонии, ударках и басе), но делают трек интереснее при повторных прослушиваниях
То есть, если мы слышим второй лид, гармонизирующий основной лид или два равнозначных лида, или контр-ритм (условные хай-хэты с off-beat паттернами), или ear candy в левом ухе в виде звука подброшенной монеты - трек 100% не нейрослоповый.
Проблема в том, что у очень многих людей ненатренерованный слух (они просто не обращают на эти элементы внимание, даже если их уши в принципе фиксируют их наличие в треке), плюс большинство слушает на довольно дешёвом аудиооборудовании, и там эти элементы аранжировки слышно хуже, чем на более-менее нормальных ушах вроде условных Soundcore Space One.
Если что, всё что я выше расписал, это мои личные наблюдения, а не копипаста откуда-то. Просто я некоторое время увлекался продюсированием и аранжировкой, и для себя отметил вот эти нюансы, когда игрался с Suno пятой версии где-то пару месяцев назад.
UPD: перечитал свой коммент, вышло так, что он отвечает и на первый первый вопрос "какая разница, кто написал, если нравится". Разница как раз в продолжительности жизни песни.
Типичный нейрослоповый трек без контр-мелодий, контр-ритма и ear candy может понравиться с первого раза благодаря яркому припеву или знакомой гармонии. Но она быстро надоест. На 3-й и 5-й раз слушать её будет скучно, потому что там нет глубины — уху не за что зацепиться, кроме первого плана. Человеческая музыка "живет" долго именно за счет этих скрытых слоев аранжировки. Даже если вы их не замечаете, ваши уши всё равно фиксируют их наличие в треке.
Я когда-то читал, что есть такие любители музыки, которые не ходят на концерты, потому что дирижёр дает своё восприятие, а не доносит в чистом виде написанное композитором. Поэтому они просто читают ноты. Кстати, ИИ же может сделать нотную запись?
Аналогия про дирижёра не в тему. Там спор про точность передачи чужого замысла: дирижёр интерпретирует, а не искажает. Я же говорю не про интерпретацию, а про физическое наличие или отсутствие определённых элементов в самой записи.
В отредактированном первом комментарии я уже упомянул, что эти элементы нужны для увеличения срока жизни песни, но это не единственная причина их добавления в трек. Есть довольно устойчивое наблюдение в психоакустике и звукорежиссуре: человеку не нравится стерильная цифровая тишина, и мозг лучше вовлекается в сигнал с лёгкой шумовой текстурой - отсюда фоновый шелест плёнки или розовый шум прямо в синтезаторе. Слушатель чаще всего не осознаёт эту деталь напрямую, а она всё равно влияет на то, нравится ему трек или нет. То же самое с контр-мелодией и ear candy - их не обязательно слышать, чтобы они делали своё дело.
По нотам - генераторы MIDI-последовательностей есть, но по факту это сырой черновик, а не готовое решение: библиотеки плохо оживляют такие партии, тайминг и артикуляцию всё равно приходится дотягивать руками.
Это просто любители нот
Мне кажется чем дальше, тем умнее станут музыкописные ИИ. Уже сейчас ИИ предлагает попробовать не 1-Click песню написать, а накидать ее в условном FL-Studio. Если ее соберут таким способом и еще дополнительно не поленятся прошерстить и исправить недочеты - то такие треки будет крайне трудно отличить от настоящих.
Что на счет аранжировки, тут все зависит имхо от скилла промптописателя. В моем топе находиться данная композиция, где на мой взгляд ваши пункты частично покрываются:
Я ни разу не музыкант, поэтому могу ошибаться (Сообщество было бы очень радо если бы вы смогли привести примеры к каждому вашему описанному пункту. Нам очень интересно услышать человека из индустрии!).
Отдельно хочу подчеркнуть что хоть в моем рационе и есть ИИ музыка, я потребляю ее разумно. И категорически против массового захламления интернета нейрослопом - пусть от YouTube отпочковывается AiTube, и засоряют там харды гугла сколько душе им влезет.
Я подписан на одно сообщество, где регулярно выкладывают альбомы разных стилей. Так вот, то что называется Easy listening - по-моему нейрослопа там уже больше половины существенно, настолько эти треки однообразные и "одноразовые".
А еще я слушая музыку через не совсем дешевые колонки, вдруг поймал себя на мысли что нынешние записи почти перестали быть стерео, когда обращаешь внимание, что источник звука где-то локализован. Да и в звуковом редакторе открываешь трек, а картинка левого и правого канала практически одинакова.
Я генерировал прилично всякого через suno и прочие. Нормально оно умеет всякое. Что-то плоховато, например не может насыпать готовых семплов для атмосферки. И если специально не просить сделать гармонию сложнее - генерит примитивное. Но если попросишь - полиритмы, контр-мелодии, микро-тональность - всё будет. Если там покрутить промпт, а еще и в DAW потом поработать - там можно пилить вещи, которые и ценитель не поймет что это AI.
Другое дело, когда просто в один присест промптом генерят «сделай реп чтобы топ в чарте» - там да, выходит нейрослоп лютый. Особенно, как ни странно, выдают тексты. Почему-то стихи выше среднего llm пока не могут.
Сходи в suno, попробуй всякое типа «microtonal polyrhythm, non-trivial harmony, post-rock”. Или просто «Bach-like classical”, вот например:
https://suno.com/song/ef59d683-60a2-497f-978c-7d28bcf06255
Нисколько не хочу приукрасить, и оправдать нейрослоп. Но оно, правда, умеет так, что офигеть.
Отличная статья! К сожалению это уже наша реальность. Фильтр ИИ был бы полезен. Зная как работает яндекс, могут маркировать ИИ и продавать отдельно.
Осталось совсем чуть-чуть до Вашего создания сервиса по определению нейромузыки на Яндексе - ничто не мешает Вам запустить сайт с таким сервисом. Заодно и посмотрите, насколько на самом деле слушателям важно отличать истинную музыку от ИИ.
И второй момент - сэмплы и звуковые эффекты композиторы могут создавать так же с помощью ИИ, и может получиться так, что композитор сочинял свою музыку, а в итоге его обвиняют в том, что его музыка сгенерирована. Как точно разделять эту грань творчества?
Заодно и посмотрите, насколько на самом деле слушателям важно отличать истинную музыку от ИИ.
Расширение уже больше месяца существует. Сейчас WAU примерно 1000 человек.
Как точно разделять эту грань творчества?
Сервисы сами будут решать, судя по всему. Где-то будут разрешать музыку, где-то будут маркировать и демонетизировать. Deezer и Tidal вот маркируют и демонетизируют.
После того как я поинтересовался одним исполнителем и прочитал, что он честно признается в том, что с помощью ИИ создает музыку и вокал, я стал замечать искусственные голоса и у других исполнителей. И вдруг все исполнение резко разделилось на голоса которые мне перестали нравиться и на нормальные песни.
В рамках данной статьи и обсуждения я так и не уловил до конца, обсуждается только музыка, или вокал тоже? Меня больше искусственный вокал напрягает. Как будто бы я в своей девушке вдруг разглядел резиновую бабу...
Новую музыку вообще не нужно слушать, только свежие релизы от проверенных временем музыкантов. А вообще у меня на плеере скачана коллекция рока от 60ых до нашего времени, в основном это 70ые и 80ые, там не было никакого ИИ и этого более чем достаточно, чтоб закрыть музыкальные потребности.
ИИ это худшее, что было с человечеством, но пути назад уже нет.
Может и так, но качество релизов от этого не меняется. А жаль
Вот я думаю - что хуже? Убогий голый нейрослоп ( где чистый промпт, нет живого автора текста и в основе нет автора мелодии), который лежит мертвым грузом и его практически не слушают, или то примитивное дерьмо в чартах от кожаных, которое невозможно слушать нормальному человеку и которое говорит о деградации? И к этой деградации привел отнюдь не ИИ.
Справедливости ради, есть несколько ИИ-треков, которые мне нравятся. Но я бы предпочёл их не слышать ни в одной подборке, а только когда я сам руками их включаю.
Странно, что вы настолько разбираетесь в нейросетях, но не знаете, что на вашей картинке не checkerboard артефакты, а результат работы нейросети deepdream. Это обычная картинка поверх которой наложен слой того, что "распознаёт" на этой картинке нейросеть обученная распознавать собак.


Треть новых релизов на Яндекс Музыке – ИИ. Теперь точно