Водещи новини Изкуствен интелект Новаторски Новини

AI генератор създава музика по текстово описание

от TechNews.bg14/09/202314/09/2023

Изкуственият интелект навлиза неудържимо в творческата индустрия
(снимка: CC0 Public Domain)

Нова невронна мрежа Stable Audio е способна да генерира кратки аудио клипове въз основа на текстови описания. Това е проект на компанията Stability AI, която разработи технологията с изкуствен интелект Stable Diffusion за конвертиране на текст в изображения.

„Stability AI е известна най-вече с работата си с изображения, но сега пускаме първия си продукт за създаване на музика и аудио, наречен Stable Audio”, каза Ед Нютън-Рекс, вицепрезидент по аудио в компанията, цитиран от Venture Beat.

Новата система Stable Audio стъпва на същите основни AI технологии, които Stable Diffusion използва за създаване на изображения. „Идеята е много проста: вие описвате с текст музиката или звука, които искате да чуете, и нашата система ги генерира за вас”, поясни мениджърът.

Ед не е непознат в света на компютърната музика: през 2011 г. той създаде стартъпа Jukedeck, който беше придобит от TikTok през 2019 г. Въпреки това, технологията зад Stable Audio има своите корени не в Jukedeck, а във вътрешното изследователско студио за музикално производство на Stability AI, наречено Harmonai и създаден от Зак Еванс.

По думите на Еванс, текстовият модел използва техника, известна като Contrastive Language Audio Pretraining (CLAP). Моделът Stable Audio има около 1,2 милиарда параметри, което е приблизително колкото в оригиналната версия за генериране на изображения на Stable Diffusion.

[related-posts]

Възможността за генериране на аудио записи с помощта на технология не е нещо ново. В миналото творците използваха метод, наречен генериране на символи, който обикновено се прилагаше при работа с MIDI (цифров интерфейс за музикални инструменти) формат.

Генеративните възможности на Stable Audio позволяват на потребителите да създават нова музика, която надхвърля повтарящите се последователности от ноти, типични за MIDI и генерирането на символи.

Stable Audio работи директно с необработени аудио проби, за да осигури по-високо качество на изхода. Моделът е обучен на повече от 800 000 парчета лицензирана музика от аудио библиотеката AudioSparks.

„Едно от най-големите предизвикателства при създаване на текстови модели е получаването на аудио данни, които не само са висококачествени, но също така имат подходящи метаданни”, обясни Еванс.

Често срещана задачи, която потребителите задават на моделите за генериране на изображения, е стилизирането за конкретен изпълнител. Въпреки това, в случая на Stable Audio, потребителите няма да могат да се обърнат към AI с такова искане – според създателите на системата, повечето музиканти биха предпочели да бъдат по-креативни.

Моделът на Stable Audio ще се предлага както безплатно, така и с тарифен план Pro за $12 на месец. Безплатната версия позволява създаване на 20 песни на месец с продължителност до 20 секунди, докато Pro версията увеличава броя на песните до 500, а времето им за възпроизвеждане до 90 секунди, което отваря път за комерсиалното им използване.

Като част от кампанията по повод пускането на новата услуга за генериране на музика, разработчикът Stability AI ще предложи и ръководство за текстови подсказвания.

предишна статия

Европейският бизнес инвестира все повече в генеративен AI

следваща статия

Струва ли си преходът към iPhone 15 Pro

TechNews.bg

TechNews.bg е динамичен информационен ресурс за новини, анализи, пазарни данни, диалог и съвети за технологиите и тяхното приложение в бизнеса и личното пространство.

1 коментар

Anonymous 05/03/2025 at 02:10

1:
Святи Дух, ела, запали сърцата,
нека Твойта светлина ни води в нощта.
Пълни ни с мир, с любов неизмерима,
нека всеки в Твойта благодат стои.

Отговор

AI генератор създава музика по текстово описание

TechNews.bg

1 коментар

Коментари

Масовото навлизане на AI маскира по-дълбоки проблеми

Жегата от AI центровете за данни формира топлинни острови

Американските хуманоидни роботи бъкат от… китайски компоненти

Нов световен рекорд: 450 терабита в секунда по съществуващи оптични влакна

Учениците губят умения за мислене и правопис от употребата на AI

Компактни и мощни двигатели с гъвкава конфигурация от FAULHABER

Европа вече си има собствен офис-пакет: Euro-Office

30% от американските AI центрове за данни няма да заработят тази година

Изкуствен интелект изписва рецепти за психиатрични лекарства

Как автономните коли ще променят сутрешното пътуване до работа

Масовото навлизане на AI маскира по-дълбоки проблеми

Нов 2D перовскит повишава ефективността на тандемните PV клетки

Wi-Fi чип издържа на радиацията при аварии в атомни електроцентрали

Как е-колите могат да станат бекъп на електроенергийната система

Жегата от AI центровете за данни формира топлинни острови

Американските хуманоидни роботи бъкат от… китайски компоненти

QNAP TS-464 NAS: как домашният сторидж заменя облака

Brother MFC-J3960DW – когато творческите натури се развихрят в офиса

Ubuntu заприлича на Windows в консумацията на памет

MacBook Neo с течно охлаждане счупи рекорда за производителност

Космически SSD с фамозно име е защитен от радиация

Razer вдига нивото на гейминга с нова мишка и серия падове

Все още има евтини смартфони: приличен Lava Bold N2 Lite за $80

Смартфони с до 250 евро отстъпка от А1 през април

SofiaBus – безплатно приложение за градския транспорт в столицата

Обновен BgGPT 3.0 е достъпен безплатно за всички

още от категорията

1 коментар

Коментари