Анализите на данни са изключително сложна и ресурсоемка материя в днешно време, а подходът на отворения код е единственият възможен начин за успешно справяне с това предизвикателство. Без неговото разрешаване светът не би могъл да продължи пътя, по който е поел – повсеместната дигитализация. В това е убеден Деян Сарка, специалист по анализи с R, SSAS и Azure ML, който бе специален гост на форума SQL Server 2017 Discovery Day, организират от InspirIT за втора година с амбицията да се превърне в традиционно място за среща на SQL експертите в България.
„Първите статистически приложения се появиха през 50-те години и с течение на времето се развиха, но това, което се случва в момента, е безпрецедентно”, казва Сарка. Фирмите имат огромни количества данни. Тяхното анализиране е нужно повече от всякога. Сарка даде за пример финансовите организации, които трябва да долавят всякакви малки „странности” в поведението на банковите активи на своите потребители, за да установяват навреме финансови измами – в противен случай ще има много пострадали хора.
Друг показателен пример е нуждата от огромни аналитични възможности за прогнозиране на земетресения или епидемии от болести – сериозни заплахи на фона на все по-голямата концентрация на хора в метрополисите. „Имаме нужда от по-добри анализи и тази нужда е много по голяма от когато и да е”, заяви Сарка.
Картината се допълва от бързото развитие на изкуствения интелект и все по-интензивното навлизане на технологиите на „интернет на нещата”. „Има крадци, хакери, измамници, изнудвачи – за тях е по-лесно от всякога да навредят на много хора. Тези злодеи разчитат на повсеместната свързаност и благодарение на нея имат огромна власт! Това прозира и в начина, по който работят новото поколение вируси, хакванията на автомобили. Макар че засичането на измами е добре познато в банките от много години, днес във всяка област трябва да сме способни да „надушваме” измамите – а усъвършенстваните анализи са важни за това”, казва Сарка.
Подходът на отворения код, според експерта, е единственият изход от непоносимото усложняване на системите за анализ на данни. „Няма компания, колкото и голяма да е тя, която може да си позволи сама да разработва всички необходими алгоритми”, категоричен е Сарка. Като специалист в областта на анализите на данни, той определи като безспорно мъдро решението на Microsoft да се обърне към общността на отворения код за справяне с това предизвикателство. Става дума за насочването към R-езика и R-общността.
„R-езикът е с отворен код и всеки ден хиляди хора допринасят за развитието на тази система. Алгоритмите се разработват от безброй хора по света. Microsoft промени философията си и вече подпомага обществото на отворения код и ползва неговия ресурс. Поддръжката на R-Open е един умен ход, който позволи на Microsoft да стане лидер в тази област”, каза Сарка.
Прогнозата на специалиста е, че в бъдеще анализът на данни ще става още по-сложна и предизвикателна работа с навлизането на интернет на нещата и повсеместната свързаност на хора и интелигентни устройства. За експертите в областта на базите данни и анализите остава важен принципът да са добре образовани и в работата си да са наясно с това какво искат да постигнат. „Важно е да знаем базовите принципи. Технологията е само средство да постигнем нещо, което искаме – но преди това трябва да сме наясно какво желаем”, заключи Деян Сарка.