Водещи новини Изкуствен интелект Новаторски Новини

Изкуственият интелект е лесно податлив на неетично поведение

от TechNews.bg17/01/202417/01/2024

Изкуственият интелект има невероятна способност да мами хората
(снимка: CC0 Public Domain)

Моделите на изкуствен интелект могат да бъдат обучени да мамят хората, вместо да предоставят правилни отговори на техните въпроси, предупредиха изследователи от компанията Anthropic. Нещо повече, AI демонстрира невероятни способности за измама.

Anthropic е стартъп, фокусиран върху отговорното и безопасно използване на изкуствения интелект. През септември 2023 г. Amazon стана негов частичен собственик, като обеща да инвестира $4 милиарда в компанията, отбелязва PC Mag.

В един от своите проекти изследователите на Anthropic си поставиха задачата да установят дали AI модел може да бъде обучен да заблуди потребител или да изпълнява действия като например въвеждане на експлойт в защитен компютърен код.

За да направят това, експертите обучиха AI както на етично, така и на неетично поведение – те придадоха на изкуствения интелект склонност към измама, като вградиха в обучителния масив задействащи фрази, които подтикват бота да се държи неподходящо.

[related-posts]

Изследователите не просто успяха да накарат чатбота да се държи лошо, но откриха, че е изключително трудно да се елиминира такова поведение. Ботът започна да крие склонността си да мами по време на периода на обучение и оценка и продължи умишлено да дава на потребителите невярна информация, докато работи.

„Нашето изследване не оценява вероятността за появата на такива злонамерени модели, а по-скоро подчертава техните последствия. Ако даден модел проявява склонност към измама, поради “отравяне” на модела, настоящите методи за обучение по безопасност няма да гарантират сигурност и дори могат да създадат погрешно впечатление за нейното наличие”, заключават експертите.

Те обаче отбелязват, че досега не са наблюдавали случаи на умишлено въвеждане на механизми за неетично поведение в която и да е от съществуващите системи с изкуствен интелект.

предишна статия

Изкуственият интелект е лесно податлив на неетично поведение

TechNews.bg

Коментари

InfoSec SEE 2026: Предизвикателства към сигурността в ерата на AI

Киберзащита 2026: трябва да сме като Кевин от „Сам вкъщи“

InfoSec SEE 2026 очерта нова бизнес-роля: директор по използване на AI

Ново предизвикателство: заплаха ли е агентният AI за бизнеса?

От кулоарите на InfoSec SEE 2026: Как „vibe coding“ променя света на киберсигурността

Агентният AI променя съотношението CPU/GPU

За едни Първи юни носи радост, за други тишина – заедно можем да променим тази история

CAPTCHA проверките преминават към цялостен поведенчески анализ

Huawei добавя още един цвят в отворените слушалки FreeClip 2

Авиокомпании по целия свят преминават към Starlink

Въглищните електроцентрали тихомълком вредят на слънчевите панели

AI помогна за хакване на „непроницаемата“ MacOS само за 5 дни

AI не си измисля пристрастия – той ги наследява от данните

Литиево-серни батерии с удвоена плътност обещават по-издръжливи дронове

Работа на 5 места дистанционно: ИТ спец печели близо милион долара годишно

Intel е започнал производство на процесори за iPhone

Honda: не е реалистично премахването на ДВГ автомобилите до 2040 г.

Дестилирана класика и непреходна елегантност: iPhone 17e

Спокойствие и сигурен достъп – три смарт ключалки WELOCK

Литиевите батерии се оказаха по-опасни, отколкото се смяташе

Linux компютри са пробити от хакери в продължение на 9 години

HONOR 600 Pro и HONOR 600 от A1 – в комплект с безжични слушалки и на специална цена

А1 приема предварителни поръчки за новия OPPO Find X9 Ultra

Huawei добавя още един цвят в отворените слушалки FreeClip 2

Идва нова вълна в лаптопите: Googlebook с Android

ElevenMusic – това AI приложение композира песни по текстови описания

SofiaBus – безплатно приложение за градския транспорт в столицата

още от категорията

Коментари