Google разработи софтуерна технология, способна да имитира с висока точност човешки глас. Tacotron 2 ще се използва в приложения за преобразуване на текст в говор.
Системата се състои от две невронни мрежи за дълбоко обучение. Първата от тях преобразува текст в спектограма и я предава на към втора мрежа с алгоритъм WaveNet, който озвучава спектограмата, генерирайки съответните звукови елементи.
Tacotron 2 може да се справи с трудни за произнасяне думи и наименования. Освен това системата е способна да променя интонацията в зависимост от препинателните знаци.
В момента Tacotron 2 може да озвучава текстове само на английски език и само с женски глас. Очаква се технологията да бъде внедрена в услуги на Google като виртуалния помощник Google Assistant и онлайн преводача Google Translate.
Wtf iz dis pos?
не знам за какво говориш