Генеративните модели като GPT-4, Midjourney и други подобни предизвикват тревога у мнозина относно потенциала на технологията да преобърне обществото. Но един друг проблем остава извън радара на вниманието: неутолимата жажда на AI – буквално. На хоризонта се задават инициативи за ограничаване на потреблението на вода от центровете за данни.
Обучението на голям езиков модел като GPT-3 използва приблизително 700 000 литра вода. „ChatGPT трябва да „изпие“ бутилка вода от 500 мл за всеки прост разговор с приблизително 20-50 въпроса и отговора, в зависимост от това кога и къде е внедрен ChatGPT“, пишат изследователи от Калифорнийския университет Ривърсайд и Тексаския университет Арлингтън. Наскоро те публикуваха пространен анализ, разглеждащ потребността от вода в центровете за данни, където „живеят“ генеративни AI приложения.
Цифрата всъщност е малка, според изследователите. Те очакват, че с разпространението на изкуствения разум и потреблението на вода ще скочи „до небесата“. Е, освен ако не бъдат предприети стъпки за справяне с „водния отпечатък“ на центровете за данни.
Дисекция на водното потребление
Определянето на потреблението на вода у нещо толкова сложно като AI център за данни не е лесен процес. За да започнат отнякъде, изследователите трябва да знаят данни за ефективността на използването на вода и енергия (WUE/PUE) на въпросното съоръжение, откъде добива енергията си, как охлажда машините си, какви са метеорологичните условия в региона, както и какво е количеството необходима енергия за обучение на езиковия модел. наред с множество други показатели. А пък доставчиците не са склонни да разкриват толкова подобна информация.
„Тези компании… публикуват много груба информация за своето потребление на вода – или средната ефективност на потреблението на вода, или действителното общо потребление на вода, но не и двете, а и тези числа обикновено са на годишна база“, казва Шаолей Рен, доцент по електротехника и компютърно инженерство в Калифорнийския университет в Ривърсайд и главен изследовател в проучването.
В резултат на множеството неизвестни изследователите са били принудени да направят доста предположения относно естеството на съоръженията, използвани за обучение на моделите с изкуствен разум.
Макар да разчита до голяма степен на предположения, Рен твърди, че неговият екип е успял да адаптира модел, разработен от SPX Cooling Technologies, за да оцени количеството вода, използвано от различни съоръжения по различно време, като същевременно взема предвид метеорологичните условия, използвайки най-добрите налични данни. И от това изследователите са успели да дефинират изискванията за вода за различни AI модели, включително LaMDA на Google и GPT-3 на Open AI, при „разумна степен на точност“, по думите на изследователите.
Но защо е толкова жаден AI?
Докладът рисува ясна картина за жаждата на AI за прясна вода. Анализаторът на Dell’Oro Group Лукас Беран подчертава, че не AI моделите използват водата, а системите за термично управление, използвани за охлаждането на центровете за данни. „Това не е проблем с AI; това е проблем с управлението на топлината“, каза той.
В зависимост от това как и къде е изграден центърът за данни и дали сървърите са с въздушно или течно охлаждане, количеството използвана вода може да варира значително.
В статията изследователите се фокусират върху охладителните кули – форма на изпарителен охладител – защото те са „най-често срещаното решение за охлаждане за центрове за данни“. Когато водата се изпарява, тя извлича топлина от въздуха. Това явление прави изпарителното охлаждане популярно сред операторите на центрове за данни, тъй като има тенденция да използва по-малко енергия от алтернативните технологии.
Разбира се, има и други методи за охлаждане. Но всеки от тях има своята „цена“ и тя най-често е във вид на консумация на повече електроенергия от мрежата.
„Инвестирането в AI съвсем естествено ви тласка към технологии за термично управление от следващо поколение – до голяма степен отнасящи се до директно течно охлаждане и потопяемо охлаждане – за да извлечете максимална производителност от своя хардуер, както и да го направите по най-икономичния начин“, казва Беран. Въпреки че може да звучи противно на логиката, технологията за течно и потопяемо охлаждане може действително да намали количеството вода, използвано от центровете за данни, поемайки топлината по-ефективно, обясни той.
Липсата на прозрачност спъва изследванията
За да се разбере по-добре въздействието на AI върху потреблението на вода в центъра за данни, е необходима повече прозрачност, отбелязват изследователите. „От решаващо значение е да имаме по-добра видимост в WUE по време на изпълнение и да увеличим прозрачността, като държим разработчиците на AI модели, както и крайните потребители, информирани“, пишат те.
Нови евро-регулации
Изследването се появява в момент, който не е случаен. Европейската комисия е в процес на преглед на ревизиите на Директивата за енергийна ефективност, която – наред с други неща – ще въведе нови изисквания към всички центрове за данни, с изключение на най-малките. Очаква се тези изисквания да са в посока детайлно докладване и отчитане на широк спектър от показатели.
Аргументацията говори за по-добра прозрачност в работата на центровете за данни, която „е от съществено значение за оптимизирането на тези съоръжения“. „Индустрията на центровете за данни е толкова потайна, че понякога е трудно да се получат подходящите данни за изграждане на модели като този“, казва Рен. „Бих искал да видя големите облачни и колокационни хиперскейлъри да играят водеща роля, без да е необходимо да бъдат регулирани. Но чувствам, че започва да им изтича времето да направят това сами, преди да се наложи нормативното регулиране“.
Това са глупости на търкалета. Изчислителния център какво я прави тази вода? Да не би да я унищожава? Загрява я просто – нещо, което прави и всеки ТЕЦ. Тук правилният въпрос е как да се ползва по полезен начин загрятата вода.
Да го инсталират на Антарктида!
Аха значи промишлената вода не може да охлажда машините. Трябва потейна. Аре стига глупости
Водата е най-евтините охладителен агент. Но за чия сметка познайте? Могат да ползват течен азот, или хладилен агент. Но трябва да се дава, а те само да папкат искат.
Тц, тц, а АЕЦ-а, който захранва центъра за данни колко ли вода харчи…