Водещи новини Изкуствен интелект Новаторски Новини Топ новини

AI модел на Nvidia обещава чудеса в аудиото

от TechNews.bg26/11/202427/11/2024

Изкуственият интелект е на път да постигне немислими неща в създаването на музика и звукови ефекти (снимка: Nvidia)

Нов модел с изкуствен интелект на Nvidia може да генерира аудио и да смесва различни видове звуци, дори да създаде звук, който никога преди това не е чувал. Технологичният гигант нарича AI модела Fugatto, което е съкращение от Foundational Generative Audio Transformer Opus 1.

Въпреки че има аудио-фокусирани AI платформи като Beatoven и Suno, Nvidia подчертава, че Fugatto предлага на потребителите детайлен контрол върху желания резултат. AI моделът може да генерира или трансформира всяка смес от музика, гласове и звук въз основа на определени сигнали.

В блог публикация Nvidia описва подробно своя нов голям езиков модел (LLM). Според компанията, Fugatto може да генерира музикални фрагменти, да премахва или добавя инструменти от съществуваща песен, да променя акцента или емоцията в гласа и „дори да позволи на хората да възпроизвеждат звуци, които не са чували преди”.

AI моделът приема както текстови, така и аудио файлове като вход, а потребителите могат да комбинират и двете, за да настроят фино своите заявки. Архитектурата на Fugatto се основава на предишни разработки на Nvidia в областта на моделирането на реч, аудио кодирането и разбирането на аудио. Пълната версия на модела използва 2,5 милиарда параметъра и е обучена с набори от данни на системата Nvidia DGX.

Екипът, създал Fugatto, си сътрудничи с партньори от Бразилия, Китай, Индия, Йордания и Южна Корея. Сътрудничеството между хора от различен етнически произход също е допринесло за развитието на мултиакцентните и многоезични възможности на AI модела, казват от компанията.

<span data-mce-type="bookmark" style="display: inline-block; width: 0px; overflow: hidden; line-height: 0;" class="mce_SELRES_start"></span>

Говорейки за възможностите на AI модела, Nvidia подчертава, че той е способен да генерира типове аудио изходи, за които не е бил обучаван преди това. „Fugatto може да накара тромпет да лае и саксофон да мяука. Всичко, което потребителите могат да опишат, моделът може да създаде”, твърдят разработчиците.

Освен това Fugatto може да комбинира определени аудио възможности с помощта на технологията ComposableART. Потребителите могат да поискат от AI модела да генерира аудиозапис на човек, който говори френски, докато се чувства тъжен. Потребителите могат също да контролират степента на тъга и тежестта на акцента с конкретни инструкции.

В допълнение, моделът може да генерира интерполирано във времето аудио или звуци, които се променят с времето. Например, потребителите могат да генерират звук от дъждовна буря с кресчендо на гръмотевица, което изчезва в далечината. Експериментите със звукови пейзажи включват дори създаване на звук, който моделът никога не е обработвал преди това.

предишна статия

AI модел на Nvidia обещава чудеса в аудиото

TechNews.bg

Коментари

Работа на 5 места дистанционно: ИТ спец печели близо милион долара годишно

Прогноза: AI балонът няма да се спука, но ще „спихне“

InfoSec SEE 2026: Предизвикателства към сигурността в ерата на AI

Киберзащита 2026: трябва да сме като Кевин от „Сам вкъщи“

InfoSec SEE 2026 очерта нова бизнес-роля: директор по използване на AI

Ново предизвикателство: заплаха ли е агентният AI за бизнеса?

За едни Първи юни носи радост, за други тишина – заедно можем да променим тази история

Разликата в тестването на уязвимости се разширява

Хибридна приливно-фотоволтаична система черпи възобновяема енергия от речни устия

Как един център за данни изгълта 113 млн. литра вода

AI агентите могат да превърнат задачите в дигитално бедствие

Huawei очаква да завладее една трета от пазара с HarmonyOS

Първият електрически Volkswagen GTI: мощност 226 к.с. и над 400 км пробег

CAPTCHA проверките преминават към цялостен поведенчески анализ

Huawei добавя още един цвят в отворените слушалки FreeClip 2

Авиокомпании по целия свят преминават към Starlink

Въглищните електроцентрали тихомълком вредят на слънчевите панели

Дестилирана класика и непреходна елегантност: iPhone 17e

Спокойствие и сигурен достъп – три смарт ключалки WELOCK

Литиевите батерии се оказаха по-опасни, отколкото се смяташе

Linux компютри са пробити от хакери в продължение на 9 години

HONOR 600 Pro и HONOR 600 от A1 – в комплект с безжични слушалки и на специална цена

А1 приема предварителни поръчки за новия OPPO Find X9 Ultra

Huawei добавя още един цвят в отворените слушалки FreeClip 2

Идва нова вълна в лаптопите: Googlebook с Android

ElevenMusic – това AI приложение композира песни по текстови описания

SofiaBus – безплатно приложение за градския транспорт в столицата

още от категорията

Коментари