Мащабен проект с отворен код в конгреса на САЩ

Нов амбициозен проект за привеждане в цифров вид на хиляди исторически документи стартира Библиотеката на конгреса на САЩ. За целта се използват GNU/Linux и софтуер с отворен код, съобщи pcnews.ru. Финансова поддръжка на проекта ще окаже организацията Sloan Foundation.
По думите на Брюстер Кал от Internet Archive, който се занимава с разработка на технологии за цифровизиране, софтуерът с отворен код ще изиграе критична роля в реализацията на проекта.
Като основно средство в цифровизацията ще се използва системата Scribe – комбинация от хардуер и софтуер, която сканира изображения от книгите, извършва редица операции с тях, разпознава текст и предоставя на изхода добре изглеждащи печатни версии на книги с възможност за търсене на документи във формат PDF.
За обработка на картинките се използват различни програми с отворен код, сред които netpbm и ImageMagick.
Изборът на системата Scribe е продиктуван от нейната ефективност в проектите на Internet Archive – най-големия архив, който използва в своята работа решения с отворен код.

Коментар