Нов суперкомпютър на IBM, наречен Vela, е оптимизиран за изпълнение на задачи, свързани с изкуствен интелект, и работи в облака. Машината стъпва на процесори Intel Xeon Cascade Lake и ускорители Nvidia.
Всеки от възлите на HPC комплекса е оборудван с два процесора Intel Xeon Cascade Lake (в случая IBM не използва собствените си чипове POWER10) и осем ускорителя Nvidia A100 (80 GB). Размерът на RAM паметта е 1,5 TB. Включени са четири NVMe SSD диска, всеки с капацитет от 3,2TB.
Всяка двойка ускорители е свързана чрез два 100GbE интерфейса към ToR комутатор, който от своя страна е свързан към опорните комутатори чрез два 100GbE канала.
Vela е базиран в инфраструктурата на облака IBM Cloud, но в момента достъп до ресурсите на суперкомпютъра имат само специалисти от изследователската общност на IBM. В бъдеще на базата на Vela могат да бъдат създадени и други суперкомпютри.
При изграждане на системата IBM е избрал конфигурация с виртуална машина (VM). Презумпцията е, че докато „голото желязо” е за предпочитане при търсене на максимална производителност, VM подходът предлага повече гъвкавост.
Използването на виртуални машини, по-специално, осигурява възможност за динамично мащабиране на AI клъстери и преразпределяне на ресурси. В същото време разработчиците са успели да сведат намаляването на производителността до по-малко от 5%.
Vela включва 60 стелажа. Всеки шкаф има шест възела, което прави общо 360 възела и 2880 ускорителя Nvidia A100. Системата е естествено интегрирана в средата на IBM Cloud VPC, което означава, че работните AI задачи могат да използват всяка от над 200 услуги на IBM Cloud.
Въпреки че машината е създадена с мисъл за производителност и гъвкавост при големи AI натоварвания, инфраструктурата може да се разгърне във всеки от глобалните центрове за данни на IBM, от всякакъв размер, уточняват от компанията.