Водещи новини Изкуствен интелект Новаторски Новини Топ новини

AI модел на Nvidia обещава чудеса в аудиото

от TechNews.bg26/11/202427/11/2024

Изкуственият интелект е на път да постигне немислими неща в създаването на музика и звукови ефекти (снимка: Nvidia)

Нов модел с изкуствен интелект на Nvidia може да генерира аудио и да смесва различни видове звуци, дори да създаде звук, който никога преди това не е чувал. Технологичният гигант нарича AI модела Fugatto, което е съкращение от Foundational Generative Audio Transformer Opus 1.

Въпреки че има аудио-фокусирани AI платформи като Beatoven и Suno, Nvidia подчертава, че Fugatto предлага на потребителите детайлен контрол върху желания резултат. AI моделът може да генерира или трансформира всяка смес от музика, гласове и звук въз основа на определени сигнали.

В блог публикация Nvidia описва подробно своя нов голям езиков модел (LLM). Според компанията, Fugatto може да генерира музикални фрагменти, да премахва или добавя инструменти от съществуваща песен, да променя акцента или емоцията в гласа и „дори да позволи на хората да възпроизвеждат звуци, които не са чували преди”.

AI моделът приема както текстови, така и аудио файлове като вход, а потребителите могат да комбинират и двете, за да настроят фино своите заявки. Архитектурата на Fugatto се основава на предишни разработки на Nvidia в областта на моделирането на реч, аудио кодирането и разбирането на аудио. Пълната версия на модела използва 2,5 милиарда параметъра и е обучена с набори от данни на системата Nvidia DGX.

Екипът, създал Fugatto, си сътрудничи с партньори от Бразилия, Китай, Индия, Йордания и Южна Корея. Сътрудничеството между хора от различен етнически произход също е допринесло за развитието на мултиакцентните и многоезични възможности на AI модела, казват от компанията.

<span data-mce-type="bookmark" style="display: inline-block; width: 0px; overflow: hidden; line-height: 0;" class="mce_SELRES_start"></span>

Говорейки за възможностите на AI модела, Nvidia подчертава, че той е способен да генерира типове аудио изходи, за които не е бил обучаван преди това. „Fugatto може да накара тромпет да лае и саксофон да мяука. Всичко, което потребителите могат да опишат, моделът може да създаде”, твърдят разработчиците.

Освен това Fugatto може да комбинира определени аудио възможности с помощта на технологията ComposableART. Потребителите могат да поискат от AI модела да генерира аудиозапис на човек, който говори френски, докато се чувства тъжен. Потребителите могат също да контролират степента на тъга и тежестта на акцента с конкретни инструкции.

В допълнение, моделът може да генерира интерполирано във времето аудио или звуци, които се променят с времето. Например, потребителите могат да генерират звук от дъждовна буря с кресчендо на гръмотевица, което изчезва в далечината. Експериментите със звукови пейзажи включват дори създаване на звук, който моделът никога не е обработвал преди това.

предишна статия

AI модел на Nvidia обещава чудеса в аудиото

TechNews.bg

Коментари

CISO: от пазител на технологиите до бизнес-стратег

Meta и AI хардуер – поредният скъп залог на компания, която не уцелва тенденциите

Трябва ли да бъдем любезни в разговорите с чатбота?

Как автономните коли ще променят сутрешното пътуване до работа

Масовото навлизане на AI маскира по-дълбоки проблеми

Компактни и мощни двигатели с гъвкава конфигурация от FAULHABER

Придобиване на Nvidia буди тревога сред AI специалистите

Колко агроволтаика им трябва на доматите?!

Нео-облаци ускоряват AI революцията и пренареждат пазара

САЩ готвят тотална забрана за доставки на литографско оборудване в Китай

Технология на MIT решава основен проблем на 3D печата

ElevenMusic – това AI приложение композира песни по текстови описания

Първият сгъваем iPhone вече е влязъл в производство

Mercedes въвежда електронен волан без механична връзка

CISO: от пазител на технологиите до бизнес-стратег

Meta и AI хардуер – поредният скъп залог на компания, която не...

QNAP TS-464 NAS: как домашният сторидж заменя облака

Brother MFC-J3960DW – когато творческите натури се развихрят в офиса

Ubuntu заприлича на Windows в консумацията на памет

MacBook Neo с течно охлаждане счупи рекорда за производителност

Космически SSD с фамозно име е защитен от радиация

Razer вдига нивото на гейминга с нова мишка и серия падове

Все още има евтини смартфони: приличен Lava Bold N2 Lite за $80

Смартфони с до 250 евро отстъпка от А1 през април

ElevenMusic – това AI приложение композира песни по текстови описания

SofiaBus – безплатно приложение за градския транспорт в столицата

още от категорията

Коментари