Комментарии 34
Самое хреновое, что нет запоминания итерации. Я например хочу что-то добавить в понравившейся мне стилистике, или сделать другую песню в таком же стиле. Но нет, каждый раз новое. И в последнее время качество генераций очень сильно упало. По тому же запросу выдается абсолютно разный, а иногда и очень кривой результат. Даже неделю назад мне нравились 50% генераций, а сейчас качественных 20%, но не то, что мне нужно, хотя запрос тот же.
>Даже неделю назад мне нравились 50% генераций, а сейчас качественных 20%, но не то, что мне нужно, хотя запрос тот же.
Мне кажется тут есть еще фактор насмотренности (наслушанности), могу сказать то же, что и вы, но у меня это случилось месяц назад после оформления PRO и большого количества экспериментов - через пару дней начал критичнее относиться к оценке результатов генераций
Можно продолжить песню с другим текстом.
Нагенерил 10 песен в похожем стиле. Через неделю снова его использовал и совсем другой результат.
Да, тоже заметил, что качество генераций сильно упало. Более того, когда делаешь продолжение понравившегося результата, начала резать качество "рендера" звука. Такое ощущение, что битрейт падает до 64 кб/с.
Я думаю, это для бесплатных аккаунтов сделали такое.
Платить и проверять некогда.
В платных аккаунтах появилась функция "Audio Input" - нечто вроде "дорисовки, дописки" того, что дали, в похожем стиле. На бесплатном можно "дописать" от указанного времени. Причем, чем короче начальный фрагмент, тем более "вольное" продолжение :-). Так что можно взять понравившийся трек и поэкспериментировать... Я это использовал для исправления ударения, в принципе работает :-)
Спасибо за подробный гайд, суно — диавольская песочница, позволяющая творить музыкальные эксперименты. Самый любимый пример Дабстеп в стиле 20-х.
Загляните в плейлист, там есть "Lorem ipsum" исполненный хором и речь идущего к реке под драм-н-бэйс. Закидываю туда всякую дичь.
6 шагов загрузки Линукс - шедеврально! Так можно любой мануал или вообще любую книгу превратить в речитатив под музыку :)
Самый любимый пример Дабстеп в стиле 20-х.
Супер. От 20х там примерно первая минута, с 1:20 что-то резко более современое, а где-то на 3:10 чистый Skrillex.
Можно, как вариант, сгенерировать что-то интересное, в плане инструментала, потом перебить это в любимой DAW, используя нормальные семплы, подправить аранжировку, ну и для вокала нанять артиста или самому спеть. В общем, есть над чем подумать.
Ударения можно проставлять в ворде, потом оттуда копировать текст в Suno уже с ударениями - "в ворде после гласной зажмите левый Alt и наберите на цифровой клавиатуре 769"
Либо использовать сайты простановки ударений - https://webtoolsner.ru/tool/rasstavit-udareniya-v-tekste-ili-slove/?ysclid=luirwprc1y756492568
Советую еше попробовать Udio. Некоторым больше нравится и на бесплатном плане доступно 600 генераций в месяц.
У Суно под капотом диффузная модель, если я правильно понимаю. Никакого миди и пересборки треков там нет. Т. е. буквально модель типа Stable Diffusion, только обученная на мел-спектрограммах вместо картинок с котиками.
На HF лежит их предыдущая разработка - Bark TTS. При обучении Bark они обнаружили, что помимо речи модель неплохо умеет генерировать музыку, хотя не предназначалась для этого. Тогда они создали новую модель - Chirp - специально заточенную под генерацию музыки. За её развитием мы сейчас и наблюдаем.
Я сам долго использовал Bark в своих проектах. Подкупала простота локального запуска, естественный эмоциональный голос и возможность клонировать и "трансмутировать" голоса.
Диффузный подход, правда, накладывает ограничения - можно сгенерировать только кусок аудио определенной длины, около 11 секунд. Ни длиннее, ни короче нельзя. Соответственно, велика задержка.
Вторая проблема - модель не всегда следует промту и может выдавать белиберду.
Для TTS диффузный подход оказался не лучшим, зато нашел своё применение в генерации музыки. Надеюсь открытые модели появятся в ближайшем будущем.
Спасибо, становиться чуть понятнее! Вопросов много, только не могу сейчас этим заняться :-(, может через мес, другой
Ценная информация.
И есть шанс получить а-ля локальный Chirp? Ну гонять у себя, как stable Diffusion и всякие LLM.
Попользовал Suno и Udio.
Udio лучше накладывает слова на мелодию. Голос и музыка качественней. Больше возможностей дополнять песню (вступление, конец, блоки спереди/сзади) Но иногда кажется что мелодию делает достаточно однообразную. Очень плохо смешивает различные жанры, особенно несочетаемые, получается мешанина. Но Suno в плане смешивания различных жанров в том числе несочетаемых очень хорош, иногда получается очень неплохие вещи.
Как выяснилось, область применения Suno шире, чем можно было представить:
Hidden text
https://vk.com/wall-38946994_153129
Я использую Suno как помощника, когда детям задают выучить стихотворение, делаю из него песню в стиле котором им нравиться. Учиться ли так быстрее не знаю, но точно веселее.
Нажми на кнопку - получишь результат,
И твоя мечта осуществится.
Нажми на кнопку, но что же ты не рад?
Тебе больше не к чему стремиться...
В общем, напророчили.
Какой смысл мне выполнять требования по авторским правам перед этой конторой, когда на горизонте, похоже, жалобы от музыкантов? Поднимаешь черный флаг и понеслась. Наша страна сейчас и так вне закона. Единственное перед чем бы я остановился это сами музыканты. Если бы они отказались использовать нейрокартинки в оформлении альбомов, я бы в ответ отказался от нейропесен, которые нагенерировал. Так ка я сам рисую, и неплохо...
Наша страна сейчас и так вне закона
Если хочешь чтобы она таковой осталась навсегда, то конечно да. Отвечать придется, не сегодня так завтра, не завтра так на следующий год, ни тебе так твоим детям... долги копятся, ответственность ужесточается.
Страна вне мирового сообщества нежизнеспособна, Кубе хватило десятилетия санкций чтобы обнищать,.. ни тебе техники, ни электроники, ни еды, ни знаний.
Hidden text
Единственное что удерживало страну от поглощения - это мягкотелось современного общества и нежелание замараться геополитикой напрямую (а может она нужна была такая, под санкциями, как нужна северная корея или россия, размахивающая как неандерталец ядерной дубинкой).
Во первых, наша страна по пиратству электронного контента буржуев всегда была вне закона. Во вторых, как япония получила люлей за то, что вкупилась за германию, так и куба в изоляции изза ссср. Если бы такие как вы не развалили ссср за джинсы и жевачку, то куба бы себя сейчас вполне нормально чувствовала.
Suno есть, скрипач не нужен!?