Meta предложи AI генератор на музика с отворен код

Изкуственият интелект ще играе все по-значима роля и в създаването на музика
(снимка: CC0 Public Domain)

Meta разработи музикален AI генератор с отворен код AudioCraft, който създава аудио изцяло по текстова заявка от потребителя. Компанията достави на журналистите музикални образци, генерирани от софтуера с изкуствен интелект.

Музикантите експериментират с електронен звук от дълго време, но компютърните програми създават музика въз основа на съществуващи аудио файлове, докато AudioCraft генерира музика само от текстова подкана, отбелязва The Verge.

AI софтуерът съчетава три отделни AI модела: MusicGen е проектиран да създава музика и е обучен на “20 000 часа музика, притежавана от Meta или лицензирана специално за тази цел”; AudioGen генерира звуци и ефекти на околната среда; EnCodec осигурява качествена аудио обработка.

Звукови ефекти като свирки, вятър, сирени и автомобилни клаксони звучат много автентично, сторед отзивите на журналистите. Но партиите на китарата звучат неестествено за слушателите.

В момента музиката, генерирана от AudioCraft, напомня най-много на “музак” (леко унизителен термин, прилаган към повечето форми на фонова музика, независимо от източника, „музика в асансьора“), на непретенциозен атмосферен ембиент и не претендира да бъде следващият голям хит. Въпреки това Meta вярва, че AI инструментът AudioCraft може да постави началото на нова вълна в музикалната мода, точно както някога са направили ранните синтезатори.

Meta признава трудностите при създаване на AI модели за генериране на музика – задача, за която говорител на компанията твърди, че е с порядък по-трудна от генерирането на AI текст с инструмент като Llama 2. Но компанията вярва, че отвореният код на AudioCraft ще помогне за разнообразяване на данните, използвани за обучение на модела.

„Разбираме, че наборите от данни, използвани за обучение на нашите модели, не са много разнообразни: повечето от музиката в западен стил, двойките аудио-текст с текст и метаданни са написани на английски“, обясни представител на Meta.

„Споделяйки кода за AudioCraft, ние се надяваме, че ще бъде по-лесно за други изследователи да тестват нови подходи за ограничаване или премахване на потенциалните пристрастия и злоупотребата с генеративни модели“, допълват разработчиците.

Meta далеч не е пионер в генерирането на аудио с помощта на AI. Големият езиков модел MusicLM на Google генерира аудио доста успешно, въпреки че е достъпен само за изследователи.

Песен, генерирана от изкуствен интелект с глас, подобен на Drake и The Weeknd, веднага стана вирусно популярна.  Наскоро Граймс разреши използването на имитация на нейния глас в песни с изкуствен интелект. На свой ред звукозаписните компании и изпълнителите алармираха, че много модели с изкуствен интелект могат да използват защитени с авторски права материали за обучение.

Коментар