Създават модели на галактики с AMD процесори

Суперкомпютрите революционизират науката, като осигуряват нов път към галактическите открития
(снимка: CC0 Public Domain)

Националната лаборатория Оук Ридж (ORNL) е поръчала нов суперкомпютър за своето водещо изчислително съоръжение (OLCF). Той носи името Frontier и се очаква да бъде най-бързият отворен научен суперкомпютър в света, когато е готов през 2021 г. – един от първите с „exascale” изчислителна мощност от 1 exaFLOPS или повече. В сърцевината на Frontier ще бъдат както AMD CPU, така и AMD GPU.

В момента ORNL подготвя осем ключови научни приложения за Frontier. Едно от тях е CHOLLA, което изследва астрофизиката и галактическите формации – една от първите работни задачи от този клас, обработвана с помощта на графични процесори.

Изследователите, свързани с това приложение, са го пренесли от CUDA, за да работи на графични процесори на AMD в подготовка за Frontier. Те са успели да направят това относително лесно и вече откриват значителни подобрения в производителността, като очакват много повече, когато Frontier заработи. Потенциалните ползи за опознаването на Вселената са огромни.

Астрономията е наука на наблюденията”, казва Евън Шнайдер, доцент по физика и астрономия в Университета в Питсбърг, и един от главните архитекти на CHOLLA. „Но революция в астрономията през последните 40 години беше нашата способност да използваме числено моделиране, за да се опитаме да разберем как се развива Вселената. За разлика от повечето физически науки, където можете да провеждате експерименти и времевите мащаби на експериментите се случват в съответните човешки животи, в астрономията нещата се променят в много по-дълги срокове. Единственият начин да получим движеща се картина на нещата е чрез провеждане на числено моделиране”, пояснява ученият.

CHOLLA (Изчислителна хидродинамика върху паралелна архитектура) е създадена, за да осигури този времево-базиран анализ, особено съсредоточен върху образуването на галактики, като обработката му се ускорява от графичните процесори.

Вселената е съставена предимно от газ и тъмна материя”, казва Шнайдер. „Така че двете най-релевантни части от физиката тук са динамиката на флуидите, което е начинът, по който разбираме еволюцията на газа, и гравитацията, което е начинът, по който разбираме еволюцията на тъмната материя. Това са двете части от физиката, които нашият симулационен софтуер трябва да включва”, допълва той.

CHOLLA започна със симулиране (моделиране) на динамиката на течностите. Сега тя е разширена, за да има собствена гравитация и гравитация, базирана на частици, заедно с магнитно поле, което също е в процес на разработка, разказва Рубен Будиарджа, изчислителен изследовател в ORNL.

„Идеята на този проект е да се пускат симулации на галактика, подобна на Млечния път, с достатъчно висока резолюция, за да можем да включим и формирането на звезди”, уточнява ученият. Точно тук мощността на графичния процесор осигурява тласъка, необходим за истински научни открития.

„Колкото повече физика влагаме, толкова по-интензивни са изчисленията”, казва Шнайдер. „Наистина се получава хубаво съвпадение между графичните процесори и нашите крайни цели, тъй като графичните процесори могат да поемат повече изчислителна работа”.

Frontier се очаква да бъде най-бързият отворен научен суперкомпютър в света
(снимка: Oak Ridge National Laboratory)

Графичните процесори са добри в решаване на задачи с масови паралелни изчисления, допълва той. „Фундаментален проблем в изчислителната астрофизика е този за мащабите. Еволюцията на голямата картина при галактика като Млечния път зависи от процеси, които се случват в много малък мащаб. За да разберем как това се развива с времето, трябва да отчетем образуването на звезди и експлозията на свръхнова в галактиката, и тези експлозии се извършват в много по-малки мащаби отколкото е цялата галактика. Едно от нещата, които бихме искали да направим, е симулации с по-висока разделителна способност”, казва Шнайдер.

„Ако нямате достатъчно резолюция, просто трябва да се задоволите с образуването на звездите”, допълва Будиарджа. „Ако искаме да симулираме Млечния път, диаметърът му е около 50 000 парсека. Тогава обикновено диаметърът на звездните клъстери е около няколко парсека. Ако разделите тези две числа, ще получите около 10 000 клетки. Тогава имате три измерения, така че 10 000 куба е общият брой клетки в изчислителния домейн. Сега се опитваме да развием 10 000 кубични клетки за 500 милиона години еволюция, за да се образува цялата галактика. Нашата стъпка от време е хиляда години, тоест имаме общо милион стъпки. Тогава въпросът става, колко бързо можете да направите една стъпка от време, за да актуализирате около 10 000 кубични клетки? Това ви дава представа колко дълго ще трябва да работи моделът”.

Пренасянето на кода на  CHOLLA от съществуваща платформа Nvidia CUDA към отворената софтуерна платформа AMD ROCm и графичните процесори AMD Radeon Instinct се оказа леснои води до незабавно вдигане на производителността. „По-голямата част от портирането към HIP, за да работи на хардуер на AMD, бе направено за няколко часа”, по думите на Будиарджа.

Производителността с AMD Radeon Instinct MI50 е относително подобна като тази с Nvidia Tesla V100. „С Instinct MI100 осъществихме ускорение около 1,4 пъти, без да правим нищо друго. Променихме само компилирането в ROCm, за да накараме кода да стартира. Има много предимства в HIP, използвайки подобни извиквания на функции. Ако вече сте запознати с CUDA, можете да хвърлите един поглед на функцията HIP и да разберете какво прави”, казва Будиарджа.

С допълнителната производителност, което ще дойде със следващото поколение AMD графични процесори във Frontier, Будиарджа очаква необходимият мащаб за работа на CHOLLA да бъде налице.

„Връщайки се към първоначалната целева задача с 10 000 кубични клетки на галактиката Млечен път, ние сме много оптимистични, че можем да я решим, когато Frontier е готов”, казва той. „Сега дори проучваме възможностите да управляваме нещо по-голямо. Това ще бъде първата времева симулация от такъв мащаб с галактика подобна на Млечния път, която изобщо е правена. Ще бъде безпрецедентно да можем да пуснем моделиране с този размер и тази резолюция, и с цялата физика, необходима за верността на резултатите, от които се нуждаем”.

„Наблюдателните проучвания на Млечния път вече имат по-добра резолюция от която и да било от нашите симулации”, споделя Шнайдер. „Един от начините за напредък в тази област е да сравняваме данните от наблюденията с данните от моделирането и ако има несъответствие, тогава разбирате, че ви липсва някаква важна част от физиката. Но ако нямате симулации при разделителната способност, необходима за сравнение с данните от наблюденията, тогава е трудно да се направи сравнение”.

Шнайдер очаква графичните процесори AMD Instinct в суперкомпютъра Frontier на ORNL да предоставят изцяло необходимата мощност, въз основа на опита с MI100. „Хардуерните ъпгрейди са нещо непосредствено достъпно. Ако можете да направите хардуер, който работи два пъти по-бързо, тогава моят симулационен код ще работи два пъти по-бързо. Това означава, че мога да изпълнявам моделиране с по-висока разделителна способност. Наличието на достъп до тази екзаскейл машина означава голяма промяна в играта по отношение на задачите, които можем да симулираме”, завършва Шнайдер.

Коментар