Софтуер на Google имитира точно човешки глас

Tacotron 2 преобразува текст в говор, вкл. трудни за произнасяне думи

Google разработи софтуерна технология, способна да имитира с висока точност човешки глас. Tacotron 2 ще се използва в приложения за преобразуване на текст в говор.

Системата се състои от две невронни мрежи за дълбоко обучение. Първата от тях преобразува текст в спектограма и я предава на към втора мрежа с алгоритъм WaveNet, който озвучава спектограмата, генерирайки съответните звукови елементи.

Tacotron 2 може да се справи с трудни за произнасяне думи и наименования. Освен това системата е способна да променя интонацията в зависимост от препинателните знаци.

В момента Tacotron 2 може да озвучава текстове само на английски език и само с женски глас. Очаква се технологията да бъде внедрена в услуги на Google като виртуалния помощник Google Assistant и онлайн преводача Google Translate.

Коментар