Изследователи от Xerox развиват нова смарт технология, която може да разпознава и класифицира едновременно текст и изображения при дигитализиране на документи, съобщиха от компанията. Очаква се разработката да улесни категоризирането на онлайн информация, както и на информация от хартиени документи, в процеса на превръщането им в електронни.
“Досегашните инструменти класифицират и маркират или само текста, или само изображенията, така че да могат да бъдат обработвани. Но досега никой не е комбинирал и двете ефективно. Хибридният класификатор на Xerox създава споделено пространство между текст и изображения”, споделя Марко Бресан, учен, който ръководи екипа на изследователския център на Xerox в Европа.
Свързвайки изображения и текстово съдържание, новата софтуерна технология значително подобрява възможностите за управление на документи и опериране с тях. В резултат ще се постигат по-цялостни и опростени работни процеси.
Например, ако брошура на уединен хотел в Стара планина, описва условията за настаняване и включва снимки на заобикалящите го обекти и географска карта на района, след сканиране, категоризаторът автоматично ще разпознае съдържанието и ще свърже текста и изображенията. Така при онлайн търсене на уединена хижа в Централен Балкан и при зададена цена за настаняване, ще бъде визуализирана информацията от брошурата, дори ако фразата „уединена планинска хижа” не е спомената в нейния текст, поясниха от Xerox България.
Новата технология се вписва в цялостните решения на Xerox за създаване на „умни документи” и ще допринесе процесът на работа с информация да стане по-бърз, по-експедитивен и по-ефективен, посочиха от компанията.
„Ако след пътуване, човек иска да комбинира снимки и дневник от ваканцията си и да направи фото-албум или фото-блог, в който да покаже най-хубавите спомени, чрез класификатора на Xerox, той може автоматично да свърже текста от своя дневник със снимките, както и да ги обогати с допълнителна информация – напр. интернет линкове, до образуването на база, подобна на Wikipedia”, допълва Бресан.
Класификаторът ще намери приложение в наскоро открития център за дигитализиране на документи на Xerox България, където компанията превръща хартиени документи в лесно откриваеми онлайн информационни архиви. Понастоящем процесът на сканиране и индексиране на документи е частично ръководен от оператори. Хибридното класифициране ще организира управлението на документи, като подобри прецизността и елиминира ръчните операции.