AI технология разпознава говор и хора без да ползва интернет

Разпознаването на реч и на говорещия ще подобри умната битова техника
(снимка: CC0 Public Domain)

Нова технология с изкуствен интелект на японската компания Toshiba позволява на електронните устройства бързо да разпознават реч и ключови думи, без интернет връзка и достъп до облачни ресурси за обработка на данни.

Предимства на AI технологията са скоростта на самообучение и възможността за разпознаване на потребителя по неговия глас. Последната възможност може да се използва от домакинските уреди, за да реагират на команди, в зависимост от това кой ги издава.

Технологията има две основни характеристики. Първата е използването на междинни резултати при определяне на ключова дума за разпознаване на говорещия. Това намалява влиянието на околния шум и съкращава времето за разпознаване.

Втората характеристика е свързана с метод за разширяване на данните в невронна мрежа. В този случай системата използва входните данни, за да симулира нови елементи на речта. Тази техника намалява броя на образците, необходими за първоначално обучение при регистрация на нов потребител, до само три.

Сравнителна оценка въз основа на три команди от всеки регистриран потребител показва, че технологията на Toshiba осигурява точност на идентификация от 89%. За сравнение: точността на широко използвания метод за разпознаване на говорещия i-vector е 71%.

Тъй като се очаква регистрираните потребители на домакински уреди обикновено да са не повече от пет или десет, постигнатото ниво на точност се счита за напълно достатъчно.

Коментар