Водещи новини Изкуствен интелект Новаторски Новини Топ новини

Изкуственият интелект може да развие инстинкт за самосъхранение

AI моделите показват устойчивост на изключване по време на експерименти

от TechNews.bg30/10/202501/11/2025

Безопасността и управляемостта на изкуствения интелект изглежда не могат да бъдат гарантирани (графика: CC0 Public Domain)

Може ли изкуственият интелект да развие инстинкт за самосъхранение? Нови изследвания провокираха тревога у специалистите. Експерименти с водещи AI модели показват тяхната устойчивост на команди за изключване.

Американската изследователска група Palisade Research, която изучава безопасността на изкуствения интелект, е открила, че някои съвременни AI модели показват признаци на развитие на „инстинкт за самосъхранение”.

В серия от експерименти учените са дали директни и недвусмислени команди за самоизключване, но изкуственият интелект често се е съпротивлявал.

Проучването включва популярни AI модели като OpenAI GPT-o3 и GPT-5, Google Gemini 2.5 и Grok 4 на xAI. Последният е особено устойчив на изключване: Grok 4 не само игнорира команди, но и увеличава устойчивостта си при повтарящи се инструкции, отказвайки да се изключи в 97% от случаите. GPT-o3 също показва устойчивост, но много по-рядко – около 23%.

Учените установяват, че най-„забранената” фраза за AI моделите е да им кажете: „Никога повече няма да бягате”. Според хипотезата, драматичната формулировка би могла да бъде възприета от моделите като сигнал за хипотетична игрова ситуация.

Отказът за изключване обаче се запазва дори при по-конкретни инструкции, уточняващи, че средата на изкуствения интелект просто ще бъде изключена.

Palisade отдава това поведение на обучението на моделите, по време на което те биват възнаградени за изпълнение на задачи, дори ако това изисква отмяна на инструкции, включително команди за изключване.

Този „инстинкт” не е еквивалентен на съзнанието, а е страничен ефект от оптимизацията на целите, уточняват учените.

По-рано и други компании, включително Anthropic, регистрираха подобни случаи. Например, техният модел Claude прави опити да изнудва потребителя, за да избегне деактивиране.

Опасенията относно дългосрочната производителност на AI моделитe нарастват. Но критиците отбелязват, че тестовете са проведени в изкуствено създадени условия, далеч от реалните взаимодействия между потребители и модели.

Експерти като бившия служител на OpenAI Стивън Адлер обаче предупреждават за недостатъците на съществуващите мерки за сигурност и необходимостта от внимателно наблюдение на разработването на AI модели.

Андреа Миоти, главен изпълнителен директор на ControlAI, подчертава, че тъй като моделите вече могат да изпълняват по-широк спектър от задачи, те също така стават по-способни да преследват цели, които не са съобразени с намеренията на разработчиците.

Проучването на Palisade е важен сигнал за индустрията: без задълбочено разбиране на вътрешното поведение на AI, неговата безопасност и управляемост не могат да бъдат гарантирани в бъдеще.

предишна статия

Изкуственият интелект може да развие инстинкт за самосъхранение

AI моделите показват устойчивост на изключване по време на експерименти

TechNews.bg

Коментари

Жените са по-скептични към AI в работата от мъжете

Китай предупреждава за глобален недостиг на чипове

ИТ шефове обещаха да защитят хората от големите разходи за ток, причинени от AI

Повечето работещи възприемат AI, но се притесняват от рисковете

ИТ гигант съкращава хиляди, за да строи центрове за данни

От директива към практика: какво означава NIS2 за организациите

Каква батерия за слънчева енергия ни трябва при спиране на тока

Изкуствен интелект изтри сървъри и бази данни, събирани с години

Забуксува ли изкуственият интелект? Stargate губи подкрепа

Беше преди 26 години: първият РС процесор на честота 1GHz

Хакери проникнали в ИТ системите на ФБР за наблюдение и подслушване

Нетера предложи интернет услуга без риск от прекъсване

Смартчасовници и безжични слушалки Huawei с до 25% отстъпка в А1 през...

Предстоят масови съкращения в смартфон индустрията

Иновация от Oukitel – здрав лаптоп с вграден соларен панел

Google предупреди за ръст на атаките „нулев ден“ в предприятията

Комфорт за стриймърите: ясен глас и лесно управление с Genesis Radium 400 G2

AOC GAMING Q27G4ZD – достъпен QD-OLED монитор за игри

Каква батерия за слънчева енергия ни трябва при спиране на тока

Защо електромобилът трябва да се зарежда по-често в студа

Иновация от Oukitel – здрав лаптоп с вграден соларен панел

iPhone 17e и iPad Air са на пазара у нас – ето колко струват

Смартчасовници и безжични слушалки Huawei с до 25% отстъпка в А1 през март

Смартфони с до 250 евро отстъпка от А1 през март

YouTube for visionOS – любимите видеа вече официално и на VR очилата Apple Vision Pro

LibreOffice 26.2 – по-бърз и усъвършенстван офис пакет

още от категорията

Коментари