Водещи новини Изкуствен интелект Новаторски Новини Топ новини

Изкуственият интелект все повече мисли като хората – това е опасно

от TechNews.bg19/07/202520/07/2025

Способността на хората да наблюдават как AI взема решения може скоро да изчезне и това крие огромни рискове (снимка: CC0 Public Domain)

Способността на хората да разбират как изкуственият интелект взема решения може да изчезне скоро – и това заплашва безопасността на бъдещите AI модели, предупредиха експерти.

Група водещи изследователи от DeepMind, OpenAI, Meta, Anthropic и няколко академични и нестопански организации публикуваха съвместен доклад с тревожно послание: способността да се наблюдава как AI взема решения може скоро да изчезне.

Докладът е подписан от носителя на наградата Тюринг – Джефри Хинтън и съоснователя на OpenAI – Иля Суцкевер, наред с други известни фигури от технологичната индустрия, става ясно от публикацията в ArXiv.

Фокусът на посланието е върху т.нар. “вериги на мисълта” или “вериги на разсъждението” (CoT), които се използват в съвременните езикови и мултимодални модели. Това са междинни стъпки, през които AI „разговаря” вътрешно, преди да даде отговор. CoT са особено важни при решаването на сложни проблеми, които изискват логика, планиране или работа с числа.

Докато изкуственият интелект остава „прозрачен” и позволява на човека да следва неговия ход на мисълта, хората ще могат да откриват грешки, пристрастия или потенциално опасно поведение.

Авторите на статията обаче предупреждават, че с нарастване на възможностите на AI и усложняването на архитектурите, способността за наблюдение на такива вериги може да отслабне. Моделите може да започнат да „крият” вътрешните си стъпки, оптимизирайки поведението си за съответствие с външни показатели.

Подобно поведение вече е наблюдавано в някои случаи, когато изкуственият интелект е „мамил” системата за възнаграждение или е манипулирал, за да постигне дадена цел. Ето защо учените призовават за спешно осигуряване на наблюдението на веригите на разсъждения като една от ключовите мерки за сигурност.

Групата предлага на разработчиците на AI да проучат какви свойства на моделите правят разсъжденията им видими за хората, как да поддържат тази прозрачност при обучение на по-мощни системи и как наблюдението на CoT може да бъде интегрирано в процесите на тестване и сертифициране.

Забележително е, че статията на групата изследователи се превърна в рядък пример за сътрудничество между конкуриращи се гиганти в индустрията на изкуствения интелект.

предишна статия

Изкуственият интелект все повече мисли като хората – това е опасно

TechNews.bg

Коментари

Повечето AI лидери нямат нужните основи, за да внедрят AI във финансите

AI „хомогенизира“ човешкото изразяване и мисъл

Изкуственият интелект регулира измамните майстори

Идентичността остава “ахилесовата пета” в облачните среди

ИТ индустрията нажежава спора за мястото на AI в армията

От директива към практика: какво означава NIS2 за организациите

AI трябваше да улесни работата на хората, но стана обратното

Meta отлага обещаващия AI модел „Avocado“ за май

Очакваме твърдотелни батерии за е-коли с пробег над 1500 км

AI еуфорията може да ни попречи да видим реалността добре

AOC 16T20E2 – преносим монитор за професионалисти

Леки фотоволтаици могат да отключат 85 GW неизползван потенциал в Европа

Криптопазарите се справят с макроикономическа волатилност

Избраха външните експерти за удостоверяване на машините за гласуване

Фалшиви реклами на Claude AI разпространяват зловреден код

GPS смущенията: невидимата битка на войната в Близкия Изток

AOC 16T20E2 – преносим монитор за професионалисти

Комфорт за стриймърите: ясен глас и лесно управление с Genesis Radium 400 G2

SSD за дистанционна работа: опростява процеса и пести време

Каква батерия за слънчева енергия ни трябва при спиране на тока

Arsen 302BT – стилна озвучителна система за геймъри

Иновация от Oukitel – здрав лаптоп с вграден соларен панел

Новите смартфони Galaxy S26 – на лизинг с 0% лихва от А1

Смартчасовници и безжични слушалки Huawei с до 25% отстъпка в А1 през март

YouTube for visionOS – любимите видеа вече официално и на VR очилата Apple Vision Pro

LibreOffice 26.2 – по-бърз и усъвършенстван офис пакет

още от категорията

Коментари