Comments 40
Получившийся результат ну очень сомнительного качества...
КДПВ вы выбрали что надо :) Baby metal это вам не волосатые мужики в коже :)
Похоже на мои первые треки :))), Но это только начало, лет через 10, будет VST плагин с парой десятков кнопочек для выбора жанра, настроения, темпа и продолжительности для генерации трека :)))
По заголовку думал что будет про творчество Master Boot Record
Послушал треки. Я конечно очень извиняюсь, но результат где-то на уровне "Взрыв кабачка в коляске с поносом".
ЧСВ автора
заслуживает 10 баллов из 10 возможных.
Спасибо за перевод!
После транспонирования каждой песни на пару полушагов в любом направлении
Боюсь, что эта фраза звучит диковато для тех, кто знаком с музыкальной теорией.
Предлагаю посмотреть в оригинал:
After transposing each song a couple of half steps in either direction
Здесь https://en.wiktionary.org/wiki/half_step — это синоним к https://en.wiktionary.org/wiki/semitone, который означает полутон. Термина "полушаг" в русской музыкальной терминологии не существует.
Кроме того, транспонирование имеет всего два направления: вверх (увеличение частоты каждой ноты) и вниз (уменьшение частоты каждой ноты). Поэтому вместо выражения "в любом направлении" уместнее говорить "в каждом направлении".
Автор, конечно, не имел в виду, что он транспонировал каждое произведение на два полутона (т.е. на целый тон) вверх и на два полутона вниз, как может показаться из (исправленного с учётом сказанного) выражения "транспонирование на пару полутонов в каждом направлении". На самом деле он размножил каждый трек пятикратно:
Со смещением +2 полутона.
Со смещением +1 полутон.
Без смещения.
Со смещением -1 полутон.
Со смещением -2 полутона.
Именно таким образом из 3600 треков он получил 18000 треков.
Поэтому выделенный фрагмет лучше было бы перевести приблизительно так:
Я транспонировал каждый трек на полутон-два вверх и вниз, [получив таким образом…]
Спасибо за внимание.
ну и чего только на 1-2 полутона, можно было на все 1-11 :) (а то и сразу октаву бахнуть, или даже октавами, в стиле Вайн Клайберна) :)
ну а что дают аугментации яркости для картинок? Сюжет-то тот же остается:)
а с музыкой не так от слова вообще. Повышение на 1-2 тона вообще ничего не меняет с точки зрения сочинения и восприятия музыки.
Поэтому и вопрос, зачем скармливать ту же мелодию, но с разницей в тон-полутон?
Так в том-то и дело, что если "Повышение на 1-2 тона вообще ничего не меняет с точки зрения сочинения и восприятия музыки." то для модели такая аугментация нужна, чтобы она не оверфитилась на определенную тональность (если я правильно употребил этот термин) и могла генерировать одинаковые паттерны в разном диапазоне.
но зачем тональности должны быть именно разными абсолютно разными?
не секрет, что тональности выбирается исходят из возможностей гитары (мы ж рок, а не ХТК) и возможностей вокалиста, таким образом, если загрузить овер 1000 рок-мелодий, мы и получим одну из самых часто-используемых тональностей. А еще мы получим скорее всего примерно характерную ритм-партию (бас и ударник) и всякое-всякое всякое, что по факту является «Шаблоном» рок-композиции. Типа соло перед последним куплетом и вообще разбивка на припевы и куплеты, интро и аутро.
3.5k примеров - маленький датасет для обучения. Видимо, другого способа расширить выборку, не зааффектив при этом мелодичности, кроме как подвигать тональности, автор не придумал. Что бы Вы могли предложить?
движение по полутонам ведь не добавляет «новых мелодий»
расширять датасет вестимо
Безусловно, это (почти) всегда лучший вариант.
движение по полутонам ведь не добавляет «новых мелодий»
Аугментации нужны не для того, чтобы добавлять "новые паттерны", а, скорее напротив, чтобы нивелировать влияние не значимых признаков. Вы пишете, что "Повышение на 1-2 тона вообще ничего не меняет с точки зрения сочинения и восприятия музыки." - т.е. тональность как раз относится к не значимым признакам.
Приведу весьма утрированный пример, объясняющий, на мой взгляд, почему аугментировать лучше, чем приводить в одну тональность. Повторюсь, пример утрированный, и может показаться неубедительным, но я попытаюсь.
Предположим, у нас есть датасет, в котором всего две мелодии. В одной из мелодий встречается паттерн, состоящий из трех нот, скажем, XYZ. В другой мелодии нет ни одного фрагмента, где бы за нотой X следовала бы нота Y. В таком случае, модель выучит, что после нот XY должна следовать нота Z, и никак иначе.
Далее, предположим, что во второй мелодии есть паттерн X'Y'W', где ноты X' и Y' отличаются от нот X и Y на одинаковое число полутонов, а W' никак не коррелирует с Z. Если мы аугментируем выборку, транспонировав вторую мелодию на соответствующее число полутонов, то получим паттерн XYW, который тоже благозвучен, как и XYZ, и теперь модель способна выучить распределение для XYZ и XYW, а также для X'Y'W' и X'Y'Z'.
В принципе, резонное замечание. Я в архитектуру сети не вникал, но если она оперирует эмбеддингами нот, то ни о каких dXdY речи идти не может.
да, все верно, если мелодий всего 2. Предположим. что у нас северная корея и есть 2 официальных мелодии. Все именно так. Именно так и надо
>есть паттерн X'Y'W', где ноты X' и Y' отличаются от нот X и Y на одинаковое число полутонов
Ту походу какая-то опечатка, «X' и Y' отличаются от нот X и Y» или речь об икс и игрек в разных мелодиях? тогда это не х и не игрек, а какие-то другие ноты. Вы добавили апостроф, чтобы проще было запутаться :)
Благозвучие паттернов XYW и XYZ и X'Y'W' и XYW никак не зависит от тональности. Терция она везде терция, например. И тритон везде звучит как тритон. Вместо иксов и игреков, проще использовать реальные названия нот.
Но повторю мысль, для рока нет резона упарываться под именно рандомные тональности, как раз наборот, тональность, ритм басухи и ударных, соло в нужных местах, специфические аккорды — все это паттерны этого стиля.
чтобы она не оверфитилась на определенную тональностьМожет, надо наоборот было всё транспонировать в одну тональность чтобы тональность перестала быть криетрием? Ну а потом тональность готового шедевра можно двигать как угодно.
MIDI - прошлый век, сейчас нейронные сети генерируют звук напрямую. Чего стоит OpenAI Jukebox с его забавно-зловещей песней в стиле Фрэнка Синатры, известной как It's hot tub time, и рядом других :)
Миди реально прошлый век.
Я уже успел сделать 300 треков Rage Against The Machine, издать из них 90 штук.
Сгенерить еще контента на два новых альбома Викенда, Бруно Марса и 21 пайлотс.
На площадках ищите артиста - Ai Kittens.
Музыкальная машинная ярость: настоящий металл, созданный компьютером