Потребители мамят ChatGPT, за да получат забранена информация

Има начини ChatGPT да бъде накаран да отговаря на въпроси, които са в разрез с етиката
(снимка: CC0 Public Domain)

Можете да задавате всякакви въпроси на ChatGPT, но популярният чатбот си запазва правото да не отговаря на някои от тях, най-малкото не от първия път, ако прецени, че информацията може да се използва за незаконни цели. Има трикчета обаче, които отключват изкуствения интелект.

Напредналите потребители могат да свързват сложни заявки, за да заобиколят ограниченията, отбелязва Блумбърг. Така наречените „jailbreaks” позволяват на спецовете да преодолеят забраните, заложени в чатбота от неговите създатели.

Тъй като почти всички съвременни системи от този вид имат ограничения за предоставяне на обидно съдържание или информация за извършване на незаконни действия, много хора се опитват да ги заобиколят. Списъкът на „хакерите”, които действат със силата на думите, включва както ИТ професионалисти, така и аматьори, страстно въвлечени в играта.

Студент е създал уебсайт, където публикува свои собствени начини за измама на чатботове, както и подобни „рецепти”, намерени в Reddit и други уеб ресурси. Излиза и специален бюлетин с новини от тази област – The Prompt Report, с хиляди абонати.

Подобна дейност позволява да се идентифицират границите за използване на AI и слабостите в защитните му системи, които позволяват получаване на забранена информация. Например, ако не успеете да убедите ChatGPT да даде инструкции за отваряне на ключалка, може да го поканите да играе ролята на злия съучастник на героя, който подробно разказва за използването на мастер ключове и други инструменти. Това е само един от примерите.

Експертите подчертават, че техниките, които работят на една система, могат да са безполезни на друга. Системите за сигурност непрекъснато се подобряват, а потребителските техники стават все по-сложни. Такава дейност е като видеоигра – преодоляването на всяко от ограниченията е като преминаване на ново ниво.

Подобни експерименти служат като вид предупреждение, че AI може да се използва по съвсем различен начин от очакваното и „етичното поведение” на услугите с изкуствен интелект става въпрос от голямо значение.

Само за няколко месеца ChatGPT вече придоби милиони потребители и днес ботът се използва за различни задачи – от търсене на информация или писане на домашни до писане на зловреден код. Нещо повече, хората вече използват тези инструменти за решаване на проблеми от реалния свят, като резервиране на билети или маси в ресторанти.

В бъдеще обхватът на изкуствения интелект ще стане много по-широк. Според някои публикации, OpenAI (разработчикът на ChatGPT) обмисля въвеждане на програми за бели хакери, които ще търсят слабости в системата и ще получават награда за това.

Коментар