Microsoft с голям прогрес в разпознаването на реч

Худонг Хуанг, главният специалист по технологии за разпознаване на чевошка реч в Microsoft (снимка: Scott Eklund/Red Box Pictures)

Худонг Хуанг, главният специалист по технологии за разпознаване на човешка реч в Microsoft (снимка: Scott Eklund/Red Box Pictures)

Microsoft обяви, че е постигнала най-доброто в ИТ индустрията разпознаване на човешка реч от компютър, става ясно от официално съобщение в блога на компанията.

Делът на неправилно идентифицираните думи е намален до 6,3%, което е 0,3% по-малко от досегашния рекорд на IBM, обявен миналата седмица на конференцията Interspeech в Сан Франциско.

Пътят на Microsoft до това постижение е доста дълъг – преди 20 години делът на неправилно разпознаваните думи възлизаше на 43%. Оценката на резултатите е извършена в съответствие с изискванията на Националния институт за стандарти и технологии на САЩ.

Microsoft е постигнала рекорден резултат в системите за разпознаване на човешка реч, които не са базирани на системни комбинации. Напредъкът, както и при IBM, се дължи на използването на невронни мрежи, работата на които наподобява тази на биологичните процеси в главния мозък на човека.

Невронните мрежи се считат за ключова технология не само в разпознаването на реч, но и при компютърното зрение. Тези мрежи се състоят от няколко слоя, но наскоро Microsoft изобрети нов тип връзки между слоевете, благодарение на което спечели конкурса за компютърно зрение ImageNet 2016.

Коментар