WaveNet имитира естествена човешка реч

Компютрите напредват с усвояване на човешката реч. Google съобщи за значителен напредък в генерирането на говор с естествено звучене, благодарение на невронни мрежи. Компанията мечтае за пълноценно общуване на хората с машините на естествен език.

Британската компания DeepMind, която е собственост на Google, е постигнала значителен прогрес в технологиите за компютърно генериране на човешка реч. Приближава денят, когато машините ще заговорят по човешки, пише Файненшъл Таймс.

Разработчиците от DeepMind вярват, че тяхната технология ще съкрати разрива между естествената човешка реч и тази, създадена от съвременните компютърни системи. Наречена WaveNet, технологията може да генерира реч, която имитира всеки човешки глас и звучи по-естествено от звука на най-добрите съществуващи системи за превод на писмен текст в реч.

DeepMind е тествала системата с музика – в частност, за генериране на кратки композиции на фортепиано на базата на анализ на класическа музика. Резултатите са впечатляващи. В момента WaveNet не се използва в нито един от продуктите на Google, но несъмнено в бъдеще технологията ще намери приложение в услугите на интернет гиганта.

WaveNet се отличава от съществуващите изкуствени синтезатори на реч по това, че тя фактически възпроизвежда звукови вълни. Използвайки т.нар. невронни мрежи, които принципно имитират човешки мозък, технологията анализира изходните звукови вълни и проектира вероятни модели на реч, аналогична на човешката. За разлика от WaveNet, повечето системи за преобразуване на текст в говор възпроизвеждат звук на базата на въведени данни.

Базирана в Лондон, DeepMind иска да реализира една отдавнашна мечта – да позволи на хората да взаимодействат на естествен език с машините. Компанията специализира в изкуствения интелект и беше придобита от Google преди две години за около 400 млн. британски лири.

Коментари по темата: „WaveNet имитира естествена човешка реч”

добавете коментар...

  1. Kagetane Hiruko

    Това най вероятно ще е така, за съжаление всичко хубаво в днешни дни си има своята цена и тя е свободата на хората. Не са важни три буквените структури а тези който се намерят зад тях и дърпат конците от сенките.

  2. user

    Добре ще говорим с машините, но техният ИИ дали няма да има заложени “характеристики”, в услуга на някоя трибуквена структура.

Коментар