Изкуствен интелект е първият, забелязал, че се задава глобална епидемия. На 30 декември малка компания за изкуствен интелект, наречена BlueDot, която използва машинно самообучение за наблюдение на огнища на инфекциозни заболявания по целия свят, алармира клиентите си (включително различни правителства, болници и бизнеси) за необичаен скок на броя на случаи на пневмония в Ухан, Китай. Ще изминат още девет дена, преди Световната здравна организация официално да отвори дума за Covid-19.
BlueDot не е единствената. Автоматизирана услуга, наречена HealthMap, също долавя първите признаци. Успява да го стори и компютърен модел, управляван от Metabiota – фирма от Сан Франциско.
Но доколко наистина AI може да помогне за справянето с глобална епидемия? На този въпрос е трудно да се отговори, отбелязва MIT Technology Review. Фирми като BlueDot обикновено са пестеливи откъм детайли на кого точно предоставят информацията си и как се използва тя. Казусът обаче отваря много въпросителни, които е важно да запомним и „разплетем”.
Нож с две остриета
Случаят с успеха на изкуствения разум доведе до множество новинарски съобщения и прес-анонси – че AI е мощно ново оръжие срещу болестите, но това е само отчасти вярно и рискува да стане нож с две остриета.
Например, прекаленото доверие във възможностите на изкуствения интелект може да доведе до решения, базирани на некоректна информация; може да пренасочи обществени и държавни пари към спорни разработки за AI за сметка на сериозни иновации, които наистина заслужават подкрепа; най-сетне може да засегне и имиджа на AI – прекалените очаквания и последващите разочарования могат да имат негативно влияние: сриване на интереса и унищожаване на възможностите за финансиране в бъдеще.
Затова накратко може да се каже така: изкуственият интелект няма да ни спаси от епидемията – ала има вероятност AI да изиграе по-голяма и полезна роля при бъдещите епидемии. Прогнозирането обаче е изправено пред редица предизвикателства.
Успешните разработки
Компании като BlueDot и Metabiota използват редица алгоритми за „обработка на естествения език”, за да наблюдават новинарските емисии и официалните доклади относно здравните грижи на различни езици по целия свят, отчитайки споменаването на „високоприоритетни” заболявания като коронавирус или пък ендемични такива (като СПИН или туберкулоза). Техните инструменти за прогнозиране могат да анализират и данни за самолетните пътувания.
Така те могат да отгатнат риска от поява на заразени хора по транзитните центрове по света. Резултатите са сравнително точни. Например, последният публичен доклад на Metabiota от 25 февруари прогнозира, че на 3 март в целия свят ще има 127 000 случая на коронавирус. Това превишава реалността с около 30 000, но Марк Галиван, директор на фирмата в областта на научните данни, казва, че подобно отклонение е в границите на допустимата грешка.
Изкуственият разум определя и страните, за които е най-вероятно да докладват най-много нови случаи, включително Китай, Италия, Иран и САЩ.
Други AI системи следят и социалните медии. Те анализират публикации в сайтове като Facebook и Twitter и ги сравняват с описания на заболявания, взети от официални източници като националните здравни институти, Световната организация за животинско здраве и глобалната база данни за микробни идентификатори.
Напредък в машинното обучение
Успехът на въпросните разработки показва до колко далеч е напреднало машинното самообучение през последните години. Когато през 2013 г. Google се опита да прогнозира сезонния грип, нейният Flu Tracker не успя да предскаже нищо.
Ключов фактор за напредъка на синтетичния разум е „безконтролното” машинно обучение, казват учените. Това означава AI да се остави да идентифицира собствени поведенчески „модели в шума”, вместо да бъде трениран на предварително подготвени образци.
„Когато правите прогнози, трябва да търсите нов тип поведение”, казва Дерек Уанг, главният изпълнителен директор на друга фирма за изкуствен разумм – Stratifyd.
Какво да се прави с предсказанията
Важен въпрос е и какво да се прави с предсказанията. Първоначалното прогнозиране на BlueDot правилно определя шепа градове като важни пунктове по пътя на вируса. Това, на теория, може да позволи на властите да се подготвят, да се подсигурят ресурси, да се предупредят болниците да са в готовност, да се въведат навременни спешни мерки за ограничаване на заразата.
Но засега за властите е много трудно да преценят доколко и как да базират решенията си на AI-моделиране. Оказва се, че предупреждението на Metabiota кои страни ще бъдат засегнати в рамките на една седмица може и да е правилно, но е трудно да се прецени какво да прави с тази информация.
Все повече „шум”
Трети фактор е въпросът за намаляването на точността с разрастване на епидемията. Всичко прогнози стават все по-малко точни с разпространението на заразата. Нужни са надеждни данни за епидемията, с които AI трябва да се захрани, но те стават все по-трудно достъпни.
За сметка на това „шумът” е все повече. Източниците на новини и официални доклади рисуват все по-шарена картина. Възниква объркване относно симптомите и как вирусът преминава между хората. Медиите могат да мултиплицират или изкривят информацията; властите също могат да повлияят или да намалят значимостта на данните.
„Шумът винаги е враг на алгоритмите за машинно обучение”, казва Уанг. И според Марк Галиван, директор на Metabiota, ежедневните прогнози на компанията са били по-лесни през първите две седмици.
Следващ важен въпрос е способността на новия софтуер да „слуша” достатъчно и сериозни източници. Тук една от най-големите пречки е липсата на диагностични изследвания, казва Галиван. „В идеалния случай бихме имали тест, за да открием незабавно новия коронавирус и да тестваме всички поне веднъж на ден”, допълва той.
Освен това няма данни за промяната на поведението на хората. Не се знае кой работи от вкъщи, кой е под карантина, кой мие или не мие ръцете си. Ако искате да предскажете какво ще се случи, имате нужда от точна картина на това, което става в момента, но такава липсва.
Компромис с личните данни
Самите здравни данни също са недостатъчни. Ахмер Инам от Pactera Edge, консултант по данни и AI, казва, че инструментите за прогнозиране биха били много по-добри, ако данните за общественото здраве не са затворени в правителствените агенции, както е в много страни. Но как да стане така, че тези данни да бъдат „отворени”?
Ако изкуственият интелект се нуждае от тях като надеждни източници, за да бъде полезен, то ние трябва да приемем, че нашите лични здравни данни ще бъдат „дъвкани” от изкуствения разум. Това е неудобен компромис: за да постигнем по-добри прогнози от машинното обучение, трябва да се простим с част от неприкосновеността на личните си данни и да ги споделяме с правителства и частни компании.
Дарън Шулте, доктор по медицина и изпълнителен директор на Apixio – изградила AI за извличане на информация от пациентски регистри – смята, че за анализ на данните трябва да се отвори медицинска документация от здравните архиви. Това може да позволи на AI автоматично да идентифицира лица, които са най-изложени на риск от зараза като Covid-19, поради предходни заболявания или хронични състояния. Тогава ресурсите могат да бъдат насочени правилно към онези хора, които се нуждаят най-много от тях.
„Съществува технология за четене на регистрите на пациенти и извличане на животоспасяваща информация”, казва Шулте. Проблем е и, че тези регистри фигурират из множество бази данни и се управляват от различни здравни служби, което ги прави по-трудни за анализ. „Бих искал да пусна изкуствения интелект в този голям океан от данни”, казва той. „Но нашите данни са разхвърляни в малки езера, а не в един голям океан”.
Факторът време
Времето също е фактор. „Вирусите не действат в рамките на геополитическите граници”, казва Ахмер Инам. Той смята, че държавите трябва да вземат решение, чрез някакво международно споразумение, да публикуват данни в реално време за поставяните диагнози и болнични приеми, които след това могат да бъдат включени в глобални модели на машинно самообучение за прогнозиране на пандемии.
Разбира се, това засега е само пожелание. В различни части на света има различни правила за неприкосновеността на здравните данни. Нови техники за обработка на данни като диференциална поверителност и самообучението на база синтетични данни (а не реални данни) могат да предложат решение, ала технологията все още има доста да се усъвършенства. Изготвянето на международно споразумение за споделянето на данните пък ще отнеме още повече време.
Да. ИИ ще познае кой китаец, кога и къде ще изяде някое заразено екзотично животно и ще плъзне нещо друго