Пълно е с “мръсни” данни, щетите са огромни

Над 30% от данните, съхранявани в организациите от частния и публичния сектор, са ”мръсни” в някаква степен. Бизнесът и неговите клиенти могат да бъдат негативно засегнати от тези данни, заяви наскоро професор Венфей Фан, носител на наградата Роджър Нийдхам на Британското компютърно общество (BSC).
Под “мръсниданни професорът разбира всяка информация, която е неточна, остаряла или непълна.
Лошото качество на данните създава проблеми, твърди Фан. В Австралия, например, около 500 000 мъртъвци имат активни медицински карти. Лоши данни в Пентагона пък са довели до опит за изпращане обратно в Ирак на 200 вече убити войници.  
Не е по-добра ситуацията с качеството на данните и във Великобритания. Там са издадени 81 милиона национални осигурителни номера, при положение, че населението на страната наброява 60 милиона.
Проблемът е характерен не само за публичния сектор, алармира професор Фан. Нивата на грешни данни в бизнеса варират от 1% до 30%. В клиентска база данни с над половин милион записа, например, за една година 120 000 са станали невалидни.
Мръсните данни струват скъпо. Ефектът от грешка на брокер от Lehman Brothers, който въведе некоректно £300 милиона вместо £3 милиона, се измери с £300 милиарда на Лондонската фондова борса, припомни Фан.
Освен във финансите, фрапантни грешки с данните има и в сектора на търговията. Фан дава за пример случай, при който Dell продаде 15 000 компютъра в Чили на цени по £79, вместо по £303.
Мръсните данни струват на американския бизнес $611 милиарда, а на потребителите – $2.5 милиарда всяка година, твърди още професорът. Той вижда решението на проблема в създаване на по-добри инструменти за крос-проверки на бази данни с цел откриване на некоректните данни.

Коментар