IBM създаде енергийно-ефективен аналогов процесор за AI

Процесорите с ниска консумация могат да решат сериозен проблем на AI моделите
(снимка: CC0 Public Domain)

IBM направи още една важна стъпка към ефективната реализация на квантови компютри. Компанията създаде процесор за AI на аналогова основа, който се отличава с ниска консумация на енергия. Този пробив може да реши енергиен проблем с големите езикови модели, които стоят зад AI приложения като ChatGPT.

Големите езикови модели са невероятно сложни. Те съдържат милиарди изчислителни възли и изискват много връзки между тях. Това води до интензивен достъп до паметта и висока консумация на енергия. Един от начините за решаване на този проблем е комбинирането на памет и процесори.

IBM и Intel вече са разработили чипове, които осигуряват на всеки неврон необходимата памет, за да изпълнява функциите си. Алтернативата на този подход е извършване на операции директно в паметта, което е възможно с помощта на памет с промяна на фазата.

В нова разработка IBM демонстрира чип памет с промяна на фазата, който е по-близък до функционален AI процесор. В статия, публикувана в научното издание Nature, компанията доказва, че нейният хардуер може да извършва разпознаване на реч с приемлива точност и значително по-ниска консумация на енергия.

Паметта с промяна на фазата се разработва от доста време. Тя съчетава издръжливостта на флаш паметта с производителността на RAM. Работи чрез нагряване на малка площ от материала и контрол на скоростта на охлаждане.

Това поведение се оказва идеално за невронни мрежи. При тях всеки възел получава входен сигнал и въз основа на състоянието си определя каква част от този сигнал да предаде. Поради свойствата на паметта с промяна на фазата, тази сила може да бъде представена като единичен бит памет, работещ в аналогов режим.

При запис на информация паметта използва две основни състояния – включено и изключено. Тези състояния са създадени по такъв начин, че минимизират грешките при записване на данни. Интересното обаче е, че паметта може да се настрои да приема всяка междинна стойност между “включено” и “изключено”, възприемайки аналогово поведение.

Това е като регулиране на силата на звука на музиката, от ниска към висока, където всяко ниво на звука представлява плавен градиент на потенциални стойности. Междинните стойности могат да се използват за представяне на различна „сила“ на връзките в невронните мрежи.

IBM вече демонстрира ефективността на този подход. Описаният чип обаче е много по-близо до функционален процесор. Той съдържа целия необходим пълнеж за свързване на отделни възли и работи в мащаб, близък до големите езикови модели.

Основният компонент на новия чип е така наречената плочка – това е масив от “кръстове” (квадратна решетка), съставени от отделни битове памет с фазова промяна с размери 512 на 2048 единици. Всеки чип съдържа 34 такива плочки, което се равнява на приблизително 35 милиона бита памет с промяна на фазата.

Гъвкавостта на процесора позволява управление на силата на всяка връзка чрез променлив брой битове. Освен това е възможна комуникация между чиповете, което прави възможно споделянето на големи задачи между множество чипове.

За да демонстрират разработката си, изследователите от IBM са използвали процесор за разпознаване на реч. В пиковата си производителност той извършва 12,4 трилиона операции за всеки ват консумирана мощност. Това е в пъти по-малко от консумацията на енергия от традиционен процесор за извършване на еквивалентни операции.

Трябва да се има предвид обаче, че процесорът е оптимизиран да работи само с определен тип невронни мрежи. Освен това не е много подходящ за обучение на AI и процесът на обучение на невронната мрежа трябва да бъде адаптиран към него. Все пак, въпреки че не е универсален за AI, процесорът на IBM предлага значително намаляване на консумацията на енергия.

Коментар