Светият Граал на сеизмологията е предвиждането на земетресение. Не прогнозирането, което дава вероятност за земетресение в даден район в рамките на години или десетилетия, а предвиждане – точно кога и къде ще се случи самото голямо земетресение и каква степен ще бъде то.
Сеизмолозите единодушно биха казали, че всеки, който твърди, че може да предсказва бъдещи земетресения, е измамник. Те от десетилетия се опитват да го постигнат, но без успех. Което не значи, че земетресeнията не могат да се предвиждат.
През декември 2018 г. една група от изследователи реши да опита нещо ново. Те обявиха онлайн конкурс, отворен за всеки, в който участниците трябваше да предскажат бъдещи земетресения, генерирани от лабораторен механизъм. Хватката? Участниците трябваше да проектират свои собствени елементарни системи за изкуствен интелект за целта.
Хиляди хора от цял свят участваха. Както се съобщава от статия, публикувана в Proceedings of the National Academy of Sciences по-рано този месец, печелившите екипи са създали програмен код, способен да предвижда момента на бъдещите лабораторни земетресения с поразителна точност.
Все още не е ясно доколко това ще приложимо в реалността. Но обещанието на тези нови модели за машинно обучение предполага, че предвиждането на земетресение не е далечна и непостижима мечта, а вероятна възможност. Поразителното е, че нито един от победителите не е имал опит в сеизмологията.
Земетресенията съществуват откакто я има планетата. Ала науката сеизмология все още е съвсем млада. Количествените данни, с които сме свикнали днес – величини, интензитет – и те са млади. За изследването на трусовете в по-стари времена може да се разчита само на писания и разпокъсани исторически данни.
„Нашите сеизмологични наблюдения са доста кратки”, казва Кейси Адерхолд, сеизмолог в IRIS, консорциум от изследователи в областта, цитиран в публикация на Wired. Това означава, че въпреки огромния напредък през миналия век, нашето разбиране за физиката, предизвикваща земетресенията, е малко размита и доста теоретична.
Наличните данни са достатъчни, за да може частично да се надникне в бъдещето. Използвайки знания за предходната сеизмичност и съвременната геофизична информация, учените могат да кажат, например, че има 20% шанс даден район от „огнения пояс” да претърпи земетресение с магнитуд 7,5 през следващите 30 години. Могат да прогнозират вторични трусове, дори последователността след главния шок.
Тези изчисления са много стабилни. Но те са ретроспективни и реактивни и не могат да бъдат използвани за прогнозиране на главните трусове. А именно това е най-важното. Сеизмолозите все още не са установили категорично кои сигнали, предхождащи земетресенията, ясно обозначават точния момент, вида и интензитета.
„Дълга е историята на…, нека така да го наречем – стагнацията – по тази тема, с много малък сериозен успех”, казва Захари Рос, сеизмолог от Калифорнийския технологичен институт. „В сравнение с напредъка, който бе постигнат в областта на климата през последните няколко десетилетия, който е просто поразителен, съществуващите техники за предвиждане на земетресения бледнеят”.
Тук идва ролята на машинното самообучение. Грубо казано, това описва способността на компютърния код да абсорбира данни, да идентифицира модели, да прави избор или предвиждане, да се учи от грешките си, за да се коригира – всичко това без значителна човешка намеса. За сеизмолозите това е новост; те едва са започнали да обсъждат потенциала и на технологията по време него на големи научни конференции.
Но машинното самообучение вече се използва в реалния свят. Пол Джонсън, геофизик от Националната лаборатория в Лос Аламос в Ню Мексико и водещ автор на новото проучване, смята, че машинното обучение може да помогне за точното прогнозиране на земетресения. Вместо да използват уравнения, създадени около човешкото разбиране на сеизмологията, тези кодове ще започват „от нула”, ще консумират данни и ще използват тези данни, за да правят прогнози. Това, според учения, „ще премахне всички потенциално погрешни човешки предположения”.
Едно по-ранно проучване по въпроса използва „машина за земетресения” в лаборатория. Стоманени блокове биват притискани като сандвич около голям скален къс, какъвто формира естествените разломи. Блоковете биват бутани, притискани и дърпани. Когато скалата се пропука, ура – учените са „направили” земетресение.
Упражнявайки се с този механизъм, Джонсън и колегите му разработили компютърен модел, който да предвижда кога ще се сцепи скалата. В рамките на месеци след настройването на апарата софтуерът успял да предскаже с голяма точност кога ще се появят бъдещите „трусове”.
Но ако това би било видео-игра, това щеше да е най-ниското ниво на трудност. А в реалния живот степента на трудност никога не е занижена. Може ли машинното обучение да се справи с предвиждането на нередовните земетресения, каквито се случват в дивата природа?
Джонсън и колегите му сметнали, че екипи от различни специалисти биха могли да допринесат за приближаването до истината. Те се обърнали към Kaggle – платформа, използвана от защитниците на машинното обучение за споделяне на изследвания. В миналото тя е използвана за провеждане на състезания, включително такова, при което хората са се опитвали да открият тъмната материя.
В края на 2018 г. Джонсън и сеизмолозите хвърлиха ръкавицата: тяхната лабораторна машина със скалата ще да симулира земетресения през първата половина на 2019 г. и участниците в състезанието трябва да разработят модели за машинно обучение, които да се научат да предсказват кога ще се случат „туровете”. Петте най-добре класирани отбора ще споделят $50 000.
Резултатът? Регистрират се за участие общо 4521 отбора, включващи 5450 души. Те произхождат от всякакви области – от мобилни игри до карикатуристи, от продавачи на застрахователни продукти до изследователи на биотоковете. Екипите първо изграждат своите модели, използвайки данни за обучение: сеизмични сигнали, времетраене на земетресенията, повърхностно напрежение на скалата и др. След това изпращат до два модела на ден на съдиите, които ги тестват, опитвайки се да предскажат земетресенията, генерирани от апарата, като същевременно получават само сеизмични данни. Резултатите са оценявани въз основа на това колко точни са тези прогнози.
Петте най-добри отбора – GloryorDeath, Reza, Character Ranking, JunKoda и The Zoo – стават майстори на прогнозите за земетресение. Пълните отличници, The Zoo – екип от осем души от САЩ и Европа – е комбинация от познати и напълно непознати лица. Те успяват да вземат първото място благодарение на някои хитри хакове.
Първо, изграждат своя модел, като използват не само данните за обучение, но и данните от теста. В някои среди, казва Джонсън, това би се считало за измама. Но по този начин машинното обучение би действало в действителност: то ще се учи от обучителни масиви от данни и от опита си с истински земетресения.
Втората печеливша функция изглежда абсолютно нелогична: изследователите подават шум в потока от данни. Шумът – вибрационни данни, причинени от трафик, вятър, океани, животни или хора, които се разхождат – е „анатема” за сеизмолозите. Учените по принцип се стараят да филтрират, за да „чуват” земетресенията. Всъщност не е ясно защо вкарването на шума е направило модела по-прецизен, но това е факт.
„Някои от нещата, които хората правят, просто работят и не е задължително да знаем защо”, казва Джонсън. Една от възможностите е просто да се дават на модела повече данни, на които да се обучава.
Забележително е, че никой от победителите няма опит в сеизмологията. „За нас това беше изключително вълнуващ експеримент”, казва Лора Пирак-Нолте, астроном и физик от университета Пърдю и съавтор на изследването. Може би именно съвместната работа и именно включването на не-сеизмолози е това, което ще доведе до успеха, напук на всеобщото разбиране за величието на самотния гений.
Машинното обучение вече показа възможностите за предсказване в зоната на потъване на Каскадия в северозападната част на Тихия океан. След прослушването на 12 години сеизмични записи, регистриращи движението на тектонските плочи, алгоритъмът успя да намери модели в частите с шум, предсказващи следващото приплъзване – подобно на това човек да знае кога е следващият такт в ритъма на една песен. Затова учените са очаровани от резултатите от състезанието.