Как стать автором
Обновить

Meta* открыла доступ к нейросети AudioCraft для написания музыки

Время на прочтение2 мин
Количество просмотров1.8K

Meta* открыла доступ и опубликовала исходный код генератора музыки с искусственным интеллектом AudioCraft. Он включает три модели ИИ, каждая из которых занимается различными областями генерации звука. 

Так, MusicGen использует текстовые запросы для создания музыки. Эта модель была обучена на «20 000 часах музыки, принадлежащей Meta или лицензированной специально для этой цели». AudioGen создаёт звук по текстовым подсказкам, имитируя лай собак или шаги, и была обучена работе с разными звуковыми эффектами. Усовершенствованная версия декодера EnCodec позволяет пользователям создавать звуки с меньшим количеством артефактов. AudioCraft генерирует музыку не только на основе текстового запроса, но и может работать с уже существующими мелодиями, а также с записями с микрофона.  

Компания представила некоторые образцы музыки, созданные с помощью AudioCraft. Звуки свиста, сирен и гудения звучали естественно, а вот гитарная музыка всё же похожа на синтезированную.

«Мы думаем, что MusicGen может превратиться в инструмент нового типа — точно так же, как синтезаторы, когда они только появились», — говорится в блоге компании. 

Meta признала сложность создания моделей ИИ, способных генерировать музыку, поскольку аудио часто содержит миллионы точек по сравнению с текстовыми моделями, такими как Llama 2, у которых этих точек насчитываются тысячи.

Компания открыла код AudioCraft, чтобы разнообразить данные, используемые для его обучения. «Мы понимаем, что наборы данных, используемые для обучения наших моделей, не отличаются разнообразием. В частности, используемый музыкальный набор данных содержит много мелодий в западном стиле и включает только пары аудио-текст с текстом и метаданными, написанными на английском языке», — пояснили в Meta.

Ранее Google разработала MusicLM, большую языковую модель, которая генерирует звуки на основе текстовых подсказок и доступна только исследователям. Нейросеть способна уловить такие нюансы описания, как инструментальные риффы, мелодии и настроение.

Meta Platforms*, а также принадлежащие ей Facebook** и Instagram**:
* признана экстремистской организацией, её деятельность в России запрещена;
** запрещены в России.

Теги:
Хабы:
Всего голосов 1: ↑1 и ↓0+1
Комментарии1

Другие новости

Истории

Ближайшие события

27 августа – 7 октября
Премия digital-кейсов «Проксима»
МоскваОнлайн
11 сентября
Митап по BigData от Честного ЗНАКа
Санкт-ПетербургОнлайн
14 сентября
Конференция Practical ML Conf
МоскваОнлайн
19 сентября
CDI Conf 2024
Москва
20 – 22 сентября
BCI Hack Moscow
Москва
24 сентября
Конференция Fin.Bot 2024
МоскваОнлайн
25 сентября
Конференция Yandex Scale 2024
МоскваОнлайн
28 – 29 сентября
Конференция E-CODE
МоскваОнлайн
28 сентября – 5 октября
О! Хакатон
Онлайн
30 сентября – 1 октября
Конференция фронтенд-разработчиков FrontendConf 2024
МоскваОнлайн