
Учени от Китай разработиха физическа невронна мрежа, базирана на светлина, която постига до 99,79% точност при разпознаване на ръкописни цифри (MNIST) и превъзхожда много съвременни дигитални модели по този показател. Изчисленията във фотонната мрежа се извършват буквално „в движение”, благодарение на дифракция на светлината и оптични взаимодействия.
Създадена от изследователи на Северозападния политехнически университет и Югоизточния китайски университет, мрежата се базира на концепцията за Extreme Learning Machine (ELM) – вид невронна мрежа с фиксиран скрит слой, където обучението се осъществява изключително върху изходните тегла.
Ключовата разлика обаче е внедряването на скрития слой не чрез софтуерна симулация, а с помощта на физически оптични процеси. Всеки неврон в мрежата получава сигнали едновременно по няколко светлинни пътя – това се нарича “фотонни мултисинапси”.
Подобна конфигурация не само осигурява висока точност на разпознаване, но и значително ускорява работата. Системата постигна 99,79% точност върху набора от данни MNIST (разпознаване на ръкописни цифри), 98,26% върху Fashion-MNIST (изображения на дрехи) и 90,29% върху предизвикателния набор от данни CIFAR-10 (цветни снимки на обекти). Това е по-висока точност отколкото при повечето останали архитектури.

(източник: Zhuonan Jia, Haopeng Tao, Guang-Bin Huang, Ting Mei)
Един от ключовите фактори за успеха на фотонната мрежа е „мултисинаптичната” оптика. Вместо единична връзка между невроните, тя използва множество паралелни пътища, които се формират чрез дублиране на входното изображение и са насочени по различни траектории. Този подход повишава имунитета срещу шум, осигурява точно предаване на информация и подобрява обучението без необходимост от числено моделиране.
Благодарение на физическото изпълнение на изчисленията, обучението на модела отнема само няколко секунди. Консумацията на енергия се измерва на ниво атоджаули на операция умножение-събиране – с порядъци по-малко от съвременните цифрови чипове. Производителността на мрежата достига 2,89 TOPS/s, което прави архитектурата обещаваща за енергийно ефективни устройства с изкуствен интелект.
Освен това, фотонната мрежа не изисква сложно софтуерно обучение – цялата ѝ структура се формира благодарение на дифракцията на светлината, а обучението се случва само на ниво цифрова обработка на изходните данни. Това драстично намалява хардуерните изисквания и позволява създаване на компактни устройства, базирани на оптика.
Китайските учени вярват, че тяхната разработка отваря пътя към нови поколения „аналогови” невронни мрежи, в които изчисленията се случват със скоростта на светлината – буквално.
