Comments 13
По-мойму, музыка это отличный показатель того, что сети генерируют всякий бред. Но дисгармонию на изображениях гораздо сложнее заметить в силу различий того, как человек воспринимает визуальную и аудиальную информацию.
А почему бред?
Потому что в приведённых примерах (как и в других статьях про герацию музыки с помощью ИИ) нет музыкальной гармонии.
Что такое музыкальная гармония? И почему из этого следует, что нейронки в целом генерируют бред?
https://ru.wikipedia.org/wiki/Гармония_(музыка)
Я не говорил, что из этого следует. Я сказал, что это хороший пример. Изображения - не очень хороший пример, потому что мозг натренирован вылавливать их хаоса визуальной информации какие-то образы, в то время как слух наоборот - остро реагирует на любые отклонения.
В Википедии статья, например, про Атональность
Можно так же охарактеризовать творчество многих "натуральных" музыкантов, так что аргумент так себе
А еще хорошо видна слабость в смысловой информации. Помните фильм, снятый без правок по сценарию от нейронки?)
Сколько ни выбирал, ни писал, все время получается какая-то далекая от желаемого дисгармоничная чушь.
Лучше бы они откалибровали сеть на отдельных жанрах и выпустили бы онлайн-потоковое радио какого-нибудь безвокального транса/синтипопа/этериалвейва для воркинг и стадиинг.
Чушь же получается.
Пока что.
Но мы верим и ждем ;)
Генерируем музыку с помощью Stable Diffusion