Microsoft: Достигаме човека в разпознаването на реч

Екип от изследователи на Microsoft постигна разпознаване на говор с човешка точност (снимка: Dan DeLong)

Екип от изследователи на Microsoft постигна разпознаване на говор с човешка точност (снимка: Dan DeLong, blogs.microsoft.com)

Технология на Microsoft може да разпознава говор досущ като човек, похвалиха се от компанията в корпоративния си блог.

Грешката при машинното разпознаване на реч, WER (Word Error Rate), се свежда само до 5,9%, колкото е грешката при естественото разпознаване от човека. Подобрението спрямо миналия месец е значително – тогава показателят WER беше 6,3%.

„Достигнахме нивото на човека. Това е историческо постижение”, казва главният учен на екипа от подразделението на Microsoft за изкуствен интелект Зидонг Хуанг. Само допреди пет години специалистите не са вярвали, че това е възможно, допълва изпълнителният вицепрезидент на подразделението Хари Шум.

Историческият момент настъпи след десетилетия изследвания в тази област – още от 70-те години на миналия век съвместно с Агенцията за перспективни военни разработки (DARPA), пред която е поставена задачата за технологичен пробив в сферата на националната сигурност.

Microsoft е постигнала съществен напредък в разпознаването на говор, благодарение на използването на невронни мрежи, работата на които наподобява биологичните процеси в главния мозък на човека. Невронните мрежи се считат за ключова технология не само в разпознаването на реч, но и при компютърното зрение.

За да достигне контролна точка на равенство с човека, екипът на Microsoft използва софтуера за машинно обучение Computational Network Toolkit – проект на компанията с отворен изходен код, разпространяван чрез уеб платформата GitHub.

Коментар