
Нова разработка на невронна мрежа с „човешко зрение” надминава стандартните модели на подобни системи по показателя за енергийна ефективност. Освен това е в пъти по-точна от аналогични технологии.
Изследователи представиха системата All-Topographic Neural Network (All-TNN), която демонстрира по-човешко възприятие на изображенията, в сравнение с широко използваните конволюционни невронни мрежи (CNN). Статия за разработката беше публикувана в изданието Spectrum на IEEE.
Ключовата разлика между All-TNN и CNN е в архитектурата. CNN използва механизъм за „споделяне на теглото”, който възпроизвежда идентични детектори на характеристики в множество пространствени позиции. All-TNN има фундаментално различна структура: пространствените ѝ връзки са организирани като топографска карта на хълмист терен или изображение на микроорганизми под микроскоп.
Както обяснява един от авторите на изследването, професор Тим К. Кицман от Института за когнитивни науки в Оснабрюк, Германия, „споделяне на теглото” в CNN е инженерно решение, тъй като човешкият мозък е физически неспособен да копира знания от една област в друга.
All-TNN избягва това ограничение, благодарение на уникалната си архитектура и метод на обучение. Всяка пространствена област на мрежата има свой собствен набор от обучаеми параметри. По време на обучението се прилага „ограничение на гладкостта”, което насърчава съседните неврони да усвоят подобни, но не идентични характеристики.
В тест за разпознаване на обекти, появяващи се за кратко в различни части на екрана, All-TNN показа три пъти по-силна корелация с човешкото възприятие от CNN. Въпреки че All-TNN все още е по-слаба от CNN (43,2%) по отношение на точността на класификация на изображенията (34,5%-36%), системата демонстрира значително превъзходство в енергийната ефективност.
All-TNN е приблизително 13 пъти по-голяма по размер (около 107 милиона параметъра срещу 8 милиона за CNN), но консумира повече от 10 пъти по-малко енергия. Този резултат се постига, благодарение на способността на мрежата да концентрира ресурсите върху най-информативните части на изображението, вместо да го обработва равномерно по цялата област.
Авторите на изследването подчертават, че енергийната ефективност не е била главната им цел. Водещият мотив е създаване на архитектура, която ни доближава до разбирането на принципите както на изкуствения, така и на човешкия интелект.
Професор Кицман отбелязва, че безкрайното увеличаване на обема от данни и параметри на модела (в стремежа към мащаб) може да не е най-ефективният път, особено предвид ограничените ресурси на реалния мозък. Алтернатива може да бъде създаването на мрежи, които имитират човекоподобно поведение. All-TNN се разглежда от учените като важна стъпка в тази посока.
