ABBYY на 16 г.: от буквите до анализа на документи

Новата версия на софтуера за оптическо разпознаване на текст ABBYY FineReader е десета поред, а от пускането на първата на пазара версия досега са минали 16 години. За това време програмата е извървяла наистина дълъг път – от базовото разпознаване на букви до интелигентния анализ на цели документи.

Екатерина Прокашева, ръководител маркетинг в ABBYY, си спомня, че първата FineReader (тогава все още на фирмата Bit Software), която излиза на пазара през 1993 г., може да чете само някои най-често използвани шрифтове. Две години по-късно се появява втората версия, при която е реализиран принципът на адаптивно самообучение. В третата версия програмата вече може да използва контекст и да прави предложения за цели думи.

Голяма стъпка прави версия 4, когато програмата се научава повторно да обработва текста за неправилно разпознатите символи и по този начин да намалява степента на грешките. По-късно в пета и шеста версия програмата се научава да прави структурен анализ на страниците, т.е. да прави разлика между текст, таблици, изображения.

Днес в десета версия документите се анализират цялостно, с пълно възстановяване на всички логически структури, което облекчава работата на потребителите и ги отървава от потребността повторно да се занимават с форматиране на документите. Налице е възможност за разпознаване на текст върху сложен фон с много цветове и елементи, като така може да се прави разчитане на материали, заснети с цифров фотоапарат или дори с камера на мобилен телефон. За целта и самият интерфейс на програмата е значително преработен.

Броят на езиците, които се разпознават във версия 10, е вече 186. Борави се дори с корейски и други азиатски езици.

Коментар