Технология на Microsoft може да разпознава говор досущ като човек, похвалиха се от компанията в корпоративния си блог.
Грешката при машинното разпознаване на реч, WER (Word Error Rate), се свежда само до 5,9%, колкото е грешката при естественото разпознаване от човека. Подобрението спрямо миналия месец е значително – тогава показателят WER беше 6,3%.
„Достигнахме нивото на човека. Това е историческо постижение”, казва главният учен на екипа от подразделението на Microsoft за изкуствен интелект Зидонг Хуанг. Само допреди пет години специалистите не са вярвали, че това е възможно, допълва изпълнителният вицепрезидент на подразделението Хари Шум.
Историческият момент настъпи след десетилетия изследвания в тази област – още от 70-те години на миналия век съвместно с Агенцията за перспективни военни разработки (DARPA), пред която е поставена задачата за технологичен пробив в сферата на националната сигурност.
Microsoft е постигнала съществен напредък в разпознаването на говор, благодарение на използването на невронни мрежи, работата на които наподобява биологичните процеси в главния мозък на човека. Невронните мрежи се считат за ключова технология не само в разпознаването на реч, но и при компютърното зрение.
За да достигне контролна точка на равенство с човека, екипът на Microsoft използва софтуера за машинно обучение Computational Network Toolkit – проект на компанията с отворен изходен код, разпространяван чрез уеб платформата GitHub.