Гласовият помощник Google Assistant ще звучи още по-реалистично, благодарение на технология за синтезиране на човешка реч WaveNet, разработена от британската компания DeepMind, която бе придобита от Google през 2014 г.
WaveNet стъпва на опита на изследователите на DeepMind в разработките на изкуствен интелект. Сега технологията ще се използва за генериране на реч в гласовия помощник Google Assistant, който ще говори като жив човек, без машинен акцент.
За разлика от други технология за синтезиране на реч, WaveNet генерира звук, като избира от над 16 000 най-подходящи образци в рамките на секунда. В продължение на една година разработчиците са обучавали WaveNet да подбира най-правилната интонация.
В резултат на обучението, в момента системата сама разбира какъв тон е най-удачно да приложи в една или друга ситуация, за да звучи речта реалистично. Първоначално, WaveNet ще се използва в английската и японската версия на Google Assistant, а в бъдеще наборът от езици ще бъде разширен.