В епохата на „големи данни” често изглежда, че сме на път да се удавим в пороя от изследвания, проучвания и научни анализи. Огромното предизвикателство, пред което сме изправени сега, е как да сортираме цялата тази научна работа.
Сътрудничество между компютърни учени и изследователи в сферата на рака при Университета в Кеймбридж е довело до разработване на нова система на база изкуствен интелект (ИИ), която може да помогне за сортиране на милионите научни изследвания и най-вече да насочи учените да разкрият недогледани и пренебрегнати връзки между различните проучвания.
Науката по своята същност е процес на развитие чрез съвсем малки „частици”. Всяко ново откритие или изследване е тясно съсредоточено, „малко”, но то добавя „частица” към по-голямото познание. Днес обаче сме достигнали до положение, при което имаме такъв огромен обем от данни за всяка изследвана тема, че нито един човешки ум не може да побере всичкото натрупано знание.
„Ако сте изследовател на рака, дори и да знаехте какво търсите, буквално хиляди нови документи се публикуват всеки ден”, казва Анна Корхонен, една от разработчиците на новата система с изкуствен интелект.
Наречена LION LBD, системата първоначално се съсредоточава върху раковите заболявания, заради огромния обем изследвания и проучвания, правени по цял свят по проблема, обхващайки редица научни области. Системата включва машинно самообучение, обработка на естествен език и методи за извличане на текст, базирани на техника, наречена „откриване на литературна база” (literature-based discovery – LBD).
Разработена първоначално през 80-те години от учения-информатик Дон Суонсън, техниката LBD е предназначена да помага на изследователите да намират информация в проучванията, които биха могли да бъдат полезни, но по една или друга причина са останали недогледани и „вторични” към цялостната хипотеза на дадено изследване. Суонсън развива тази техника, след като забелязва колко широки и фрагментирани са станали научните изследвания.
„Фрагментирането на науката по специалности прави възможно да съществуват безброй двойки логически свързани литератури, които остават изолирани една от друга”, пише Суонсън в проучване, демонстриращо потенциала на LBD през 1988 г.
Първоначално LBD възниква като болезнен ръчен процес. През последните години обаче става видно, че системата е идеална за компютърни обработки. Технологиите на новото време позволяват на машините „умно” да намират връзки или модели сред различните изследвания, които хората никога не биха могли да забележат.
„Например, вие може да знаете, че дадено лекарство за рак засяга поведението на човека по определен начин, но с LION LBD може да откриете, че лекарство, разработено за съвсем различно заболяване, засяга човека по същия начин”, обяснява Корхонен, обсъждайки потенциала на новата ИИ система.
На този ранен етап системата Lion LBD е все още относително ограничена. Тя може да създава само връзки между две ключови думи или концепции и първоначално е програмирана за използване само на публично достъпни резюмета на PubMed. Разбира се, тези ограничения могат да се преодолеят бързо, тъй като изследователите, които стоят зад разработката, правят цялата система отворена и свободно достъпна.
В момента LION LBD е достъпна за всички чрез уеб портал, а целият програмен код и API са безплатни за разработчиците, които искат да сътрудничат и да я подобрят.
Хайде наскчаха червените баби почнаха теоремите на Котелников дето все били открити преди амриканските.
Горе долу всичко по-важно което нашите откриватели били открили от ония времена е благодарения на научно техничр=еското разузнаване което използваше (и още използва) свобдните публикации в западните университети и научни институти и просто го пренасяха тук.
Ку-ку бил чел … оле божке … и затова всичко компютри и софтуер, телевизори, перални, медицинска техника и пр е от соц лагера, нали.
А знаете ли що са толкова “големи” данните и що американски и други англосаксонски и въобще капиталистически “учени”, често откриват “топлата” вода, т.е. декларират сега открития и изобретения, за които съм чел още преди 30-40 години в български и руски научно-популярни списания? Защото лъжат, на поразия лъжат и плагиатстват и крадат чужди трудове.
Eдин от wikipedia bot прави същото.