Водещи новини Изкуствен интелект Новаторски Новини

AI генератор създава музика по текстово описание

от TechNews.bg14/09/202314/09/2023

Изкуственият интелект навлиза неудържимо в творческата индустрия
(снимка: CC0 Public Domain)

Нова невронна мрежа Stable Audio е способна да генерира кратки аудио клипове въз основа на текстови описания. Това е проект на компанията Stability AI, която разработи технологията с изкуствен интелект Stable Diffusion за конвертиране на текст в изображения.

„Stability AI е известна най-вече с работата си с изображения, но сега пускаме първия си продукт за създаване на музика и аудио, наречен Stable Audio”, каза Ед Нютън-Рекс, вицепрезидент по аудио в компанията, цитиран от Venture Beat.

Новата система Stable Audio стъпва на същите основни AI технологии, които Stable Diffusion използва за създаване на изображения. „Идеята е много проста: вие описвате с текст музиката или звука, които искате да чуете, и нашата система ги генерира за вас”, поясни мениджърът.

Ед не е непознат в света на компютърната музика: през 2011 г. той създаде стартъпа Jukedeck, който беше придобит от TikTok през 2019 г. Въпреки това, технологията зад Stable Audio има своите корени не в Jukedeck, а във вътрешното изследователско студио за музикално производство на Stability AI, наречено Harmonai и създаден от Зак Еванс.

По думите на Еванс, текстовият модел използва техника, известна като Contrastive Language Audio Pretraining (CLAP). Моделът Stable Audio има около 1,2 милиарда параметри, което е приблизително колкото в оригиналната версия за генериране на изображения на Stable Diffusion.

[related-posts]

Възможността за генериране на аудио записи с помощта на технология не е нещо ново. В миналото творците използваха метод, наречен генериране на символи, който обикновено се прилагаше при работа с MIDI (цифров интерфейс за музикални инструменти) формат.

Генеративните възможности на Stable Audio позволяват на потребителите да създават нова музика, която надхвърля повтарящите се последователности от ноти, типични за MIDI и генерирането на символи.

Stable Audio работи директно с необработени аудио проби, за да осигури по-високо качество на изхода. Моделът е обучен на повече от 800 000 парчета лицензирана музика от аудио библиотеката AudioSparks.

„Едно от най-големите предизвикателства при създаване на текстови модели е получаването на аудио данни, които не само са висококачествени, но също така имат подходящи метаданни”, обясни Еванс.

Често срещана задачи, която потребителите задават на моделите за генериране на изображения, е стилизирането за конкретен изпълнител. Въпреки това, в случая на Stable Audio, потребителите няма да могат да се обърнат към AI с такова искане – според създателите на системата, повечето музиканти биха предпочели да бъдат по-креативни.

Моделът на Stable Audio ще се предлага както безплатно, така и с тарифен план Pro за $12 на месец. Безплатната версия позволява създаване на 20 песни на месец с продължителност до 20 секунди, докато Pro версията увеличава броя на песните до 500, а времето им за възпроизвеждане до 90 секунди, което отваря път за комерсиалното им използване.

Като част от кампанията по повод пускането на новата услуга за генериране на музика, разработчикът Stability AI ще предложи и ръководство за текстови подсказвания.

предишна статия

Европейският бизнес инвестира все повече в генеративен AI

следваща статия

Струва ли си преходът към iPhone 15 Pro

TechNews.bg

TechNews.bg е динамичен информационен ресурс за новини, анализи, пазарни данни, диалог и съвети за технологиите и тяхното приложение в бизнеса и личното пространство.

1 коментар

Anonymous 05/03/2025 at 02:10

1:
Святи Дух, ела, запали сърцата,
нека Твойта светлина ни води в нощта.
Пълни ни с мир, с любов неизмерима,
нека всеки в Твойта благодат стои.

Отговор

AI генератор създава музика по текстово описание

TechNews.bg

1 коментар

Коментари

InfoSec SEE 2026: Предизвикателства към сигурността в ерата на AI

Киберзащита 2026: трябва да сме като Кевин от „Сам вкъщи“

InfoSec SEE 2026 очерта нова бизнес-роля: директор по използване на AI

Ново предизвикателство: заплаха ли е агентният AI за бизнеса?

От кулоарите на InfoSec SEE 2026: Как „vibe coding“ променя света на киберсигурността

Агентният AI променя съотношението CPU/GPU

За едни Първи юни носи радост, за други тишина – заедно можем да променим тази история

Huawei очаква да завладее една трета от пазара с HarmonyOS

Първият електрически Volkswagen GTI: мощност 226 к.с. и над 400 км пробег

CAPTCHA проверките преминават към цялостен поведенчески анализ

Huawei добавя още един цвят в отворените слушалки FreeClip 2

Авиокомпании по целия свят преминават към Starlink

Въглищните електроцентрали тихомълком вредят на слънчевите панели

AI помогна за хакване на „непроницаемата“ MacOS само за 5 дни

AI не си измисля пристрастия – той ги наследява от данните

Литиево-серни батерии с удвоена плътност обещават по-издръжливи дронове

Работа на 5 места дистанционно: ИТ спец печели близо милион долара годишно

Дестилирана класика и непреходна елегантност: iPhone 17e

Спокойствие и сигурен достъп – три смарт ключалки WELOCK

Литиевите батерии се оказаха по-опасни, отколкото се смяташе

Linux компютри са пробити от хакери в продължение на 9 години

HONOR 600 Pro и HONOR 600 от A1 – в комплект с безжични слушалки и на специална цена

А1 приема предварителни поръчки за новия OPPO Find X9 Ultra

Huawei добавя още един цвят в отворените слушалки FreeClip 2

Идва нова вълна в лаптопите: Googlebook с Android

ElevenMusic – това AI приложение композира песни по текстови описания

SofiaBus – безплатно приложение за градския транспорт в столицата

още от категорията

1 коментар

Коментари