Пробив в машинното зрение: AI вижда като мозъка

Нова AI технология имитира работата на зрителния кортекс на мозъка
(снимка: CC0 Public Domain)

Учени от Южна Корея и Германия разработиха нова технология с изкуствен интелект, която приближава машинното зрение до човешкото. Lp-Convolution позволява на AI да обработва изображения по-ефективно, подобно на това, което прави зрителната кора на мозъка. Резултатът е подобрена точност на разпознаване, намалени изчислителни разходи и нови перспективи в области, вариращи от автомобили без водач до медицинска диагностика.

Традиционните AI системи като конволюционните невронни мрежи (CNN) използват фиксирани филтри за анализ на изображения. Това ограничава способността им да възприемат сложни детайли. Други модели, като Vision Transformers, макар и мощни, изискват огромна изчислителна мощност, за да работят ефективно.

Новата технология Lp-Convolution решава тези проблеми, като имитира работата на зрителния кортекс на мозъка. Вместо твърди филтри, AI технологията използва гъвкави филтри, които се адаптират към формата на обекта, подобно на това как невроните в мозъка се фокусират върху ключови детайли, става ясно от публикация за разработка на корейския Институт за фундаментални науки (IBS).

Тестването на Lp-Convolution върху наборите от данни CIFAR-100 и TinyImageNet показва подобрения в точността както на класическите, така и на най-съвременните CNN модели. Нещо повече, сравнението на AI моделите с невронната активност в мозъците на мишки разкрива поразителни прилики и потвърждава биологичната правдоподобност на новия метод.

Lp-Convolution не само подобрява ефективността на CNN моделите, но също така ги прави по-малко ресурсоемки, предлагайки алтернатива на по-сложните системи с изкуствен интелект. Тази разработка може потенциално да доведе до по-ефективни и адаптивни AI алгоритми.

Научният екип планира да проучи потенциала на технологията за справяне със сложни проблеми като решаване на пъзели и обработка на видео в реално време. В опит да доразвият проекта, изследователите пуснаха кода и предварително обучените модели в хранилището GitHub. Това ще позволи на други учени да експериментират с технологията и да допринесат за нейното развитие.

Коментар