България е сред лидерите по достъп до отворените фирмени данни в Европа, става ясно от Индекса за отворени фирмени данни (Open Company Data Index), който е базиран на информация от най-голямата отворена база в света OpenCorporates.
Страната ни е на трето място по този показател, след Дания и Великобритания. Това става ясно след мащабна интеграция на данните от Търговския регистър на България, осъществена с помощ от българската компания за семантичен софтуер „Онтотекст“ АД, част от групата на „Сирма Груп Холдинг“ АД.
В резултат, в момента страната ни се представя много добре по отношение на данните, достъпни за свободно търсене, свободен достъп и отворено лицензиране, подчертаха от Онтотекст.
OpenCorporates въведе България като юрисдикция съвсем скоро, добавяйки около 970 000 нови дружества към своята отворена база с над 140 милиона компании от целия свят. В резултат сега международната база включва целия Български Търговски регистър, достъпен като отворени XML файлове, под публичния лиценз CC-0.
Проектът е реализиран с експертиза на Онтотекст в сферата на свързаните отворени данни (т.нар. Linked Open Data – LOD). Освен това българското дружество е подпомогнало екипа на OpenCorporates в по-доброто разбиране за Търговския регистър – една трудна задача както от техническа, така и от правна гледна точка.
Сред основните предизвикателства в това отношение са били разбирането на схемата, както и интерпретирането на данните, включително ръчното прехвърляне на тези, които са на кирилица.
Онтотекст участва и в редица други значими публични проекти в сферата на отворените и свързаните данни. Такъв е например европейският проект euBusinessGraph, в рамките на който се разработва платформа за интегриране, хармонизиране и публикуване на подробни данни за европейските компании.