Невронна мрежа пресъздава лицето на човек по гласа му

Полът на човек се определя лесно по гласа му (фото: CCO Public Domain)

Изследователи от Лабораторията по изкуствен интелект на Масачузетския технологичен институт съобщават за интересен експеримент. Те са обучили невронна мрежа да пресъздаде облика на лицето на човек от малък звуков запис на речта му, става ясно от публикация в arxiv.org.

Полът на човека се определя лесно от гласа му. По-трудно, но все пак възможно е определянето на възрастта по гласа. Акцент в говора пък свидетелства за националността.

Останалите параметри в анализа не дават точни съответствия и синтезираният „портрет” в крайна сметка ще бъде доста условен.

Целта на изследователите е била да проверят колко информация за външния вид на човек може да се получи от характеристиките на речта му. За да направят това, те създали невронна мрежа за синтезиране на лицето от малък аудио запис. За обучение са използвани видеоклипове на хора, които говорят в YouTube и други уеб ресурси.

Оказва се в края на краищата, че компютърът все още не е в състояние да създаде точен портрет на човек по гласа му. Системата правилно познава пола, но възрастта рядко се определя по-точно от десет години. Системата познава и етническата принадлежност, но с голяма доза условност.

Коментар