Изкуственият интелект изисква компютрите да говорят като хората

Изкуственият интелект трябва да изучава езикознание, за да обработва думите по същия начин като хората

Интерфейсът между хората и технологиите ще придобива все по-ключова роля за съвременния живот. И макар че това е добре известно, то някои изследвания извън сферата на дигиталните системи загатват за нови предизвикателства в общуването между хората и машините.

За да може човек да извлича смислена информация от множеството данни, събирани от „интелигентните” машини, с които взаимодействаме – като например мобилните телефони, компютрите трябва да „говорят” като хората. За целта те трябва да обработват езика по същия начин като човеците. Разделът от науката за изкуствения интелект, който се занимава с тази нужда, се нарича „естествена езикова обработка”. А предизвикателствата пред нея са големи, защото езикът, също като хората, непрекъснато се променя и развива.

„Обратен инженеринг” на човешкия език

Компютрите трябва да се научат да използват думите гъвкаво, подобно на хората, е изводът от анализа, който се появи наскоро в „Сборник на Националната академия на науките” на САЩ (PNAS). Зад сложното заглавие на публикацията – „Алгоритми в историческата поява на смисловите значения на думите” – стои преглед на 1000-годишното развитие на английския език.

Проучването е установило видовете алгоритми, които умовете на хората са използвали за разширяване на значенията на съществуващите думи и придаването на нов смисъл на понятията. Този „обратен инженеринг” за развитието на човешкия език може да повлияе на обработката на естествените езици от машините.

„За да общуват успешно с хората, компютрите трябва да могат да използват думите гъвкаво, но следвайки същите принципи, които ръководят използването на езика от хората”, обяснява Барбара Малт, директор на Когнитивната научна програма в университета Лехи и сътрудник на проекта. Според нея, с течение на времето думите натрупват „семейства” от свързани значения.

Например, думата „лице” базово означава предната част на главата. Но с течение на времето, думата е добила и други значения: 1. предната част на предмет; 2. изражение, физиономия; 3. човек, особа. Проучването, с което учените са се заели, „е насочено към разследване на когнитивните процеси, които създават тези семейства от значения”, обяснява Малт.

Развитие на смисловите значения

Екипът, включително и водещият изследовател Янг Ксу – компютърен лингвист от университета в Торонто – и Махеш Сринивасан, главен асистент по психология в Калифорнийския университет Бъркли, заедно с Кристиан Рамиро – студент от Бъркли – са идентифицирали алгоритъм, наречен „близкосъседско свързване”. Това е механизмът, който най-добре описва как смисловите нюанси на думите се натрупват с течение на времето.

При „близкосъседско свързване” входните точки се анализират като йерархия от клъстери. Моделът на изследователите обхваща верижния процес, който възниква, тъй като новозараждащите се идеи се изразяват чрез думата с най-близкия съществуващ смисъл. Този модел на верижно свързване отговаря на историческия модел на появата на значенията по-добре от алтернативните модели.

„Това е отворен въпрос – как алгоритмите, които изследвахме тук, могат да се прилагат директно за подобряване на машинното самообучение и работата на роботите с нови езици”, казва Ксу.

След разработване на изчислителните алгоритми, прогнозирали историческия ред на на възникване на смисловите значения на думите, екипът тествал прогнозите си спрямо записи на английски слова от миналото хилядолетие, използвайки Историческия тесаурус речник на английския език – голяма база данни, в която всяко от значенията на дадена дума е маркирано с датата на появяването му в езика.

Откритията показват, че смисловите нюанси на думите се натрупват по начин, който намалява „когнитивните разходи” – колективните усилия за създаването, тълкуването и научаването на нови смислови значения. С други думи, новите значения се появяват чрез ефективен механизъм, който изразява новите идеи чрез компактен набор от думи.

„Когато нововъзникващите идеи се закодират в езика, по-вероятно е да бъдат кодирани чрез разширяване на значението на някоя вече съществуваща дума, отколкото чрез създаване на нова дума”, казва Малт. „Популярно е схващането, че когато имате нова идея, трябва да направите нова дума за нея. Ала ние открихме, че тази стратегия всъщност е по-рядко срещана”.

Метафорично картиране

Миналата година същият научен екип идентифицира набор от принципи, ръководещи друг аспект на езиковото развитие: „метафорично картиране”. През изминалото хилядолетие смисловите значения на думите до голяма степен са се развили от областта на реалното и физическото към областта на абстрактното, метафоричното. Затова тези смислови семейства са наречени метафорични карти.

Думи, които първоначално са имали само конкретно физическо изражение (напр. „да последвам” – да тръгна след физически обект), постепенно придобиват смисъл в сферите на абстрактното и вътрешното (да „последвам” идея). Подобно развитие се основава на компактен набор от психологически и когнитивни принципи. Благодарение на тях „преминаването” на думата от една към друга реалност може лесно да бъде предвидено.

Именно такива когнитивни принципи следва да бъдат заложени в системите за машинно самообучение, за да могат интелигентните устройства да се научават да общуват безпрепятствено с човеците и общуването им да еволюира по начин, адекватен на словесното развитие на хората.

Коментар