TechNews.bg
Водещи новиниИзкуствен интелектНоваторскиНовини

Кой чатбот халюцинира най-малко? Изненада в нова класация

Оказва се, че най-популярният изкуствен интелект не е най-точният

Чатботовете често халюцинират, независимо колко популярни са (графика: CC0 Public Domain)

Халюцинациите на изкуствения интелект са често явление. За разработчиците на чатботове решаването на този проблем все още е предизвикателство, а някои ще имат повече работа за вършене, показа нова класация.

Grok, създаден от AI екипа на Илон Мъск, е признат за най-точния чатбот, с най-малко халюцинации при използване на работното място, докато ChatGPT и Gemini се нареждат близо до дъното в последната класация на Relum. Това е донякъде изненадващо, тъй като Grok не е най-популярният чатбот.

Победителят в рейтинга демонстрира най-ниския процент на фалшиви аларми от 10 водещи тествани AI модела. Grok хюлицинира само в 8% от случаите, което все пак не е никак малко и показва нуждата от сериозно усъвършенстване на чатботовете.


За сравнение, най-популярният чатбот ChatGPT на OpenAI демонстрира един от най-високите проценти на фалшиви аларми – 35%, като след него е единствено Gemini на Google, който има 38% халюцинации.

Проучването, проведено от Relum през декември, оценява чатботовете въз основа на показатели като процент на халюцинации, рейтинг от потребителите, последователност на отговорите и време на престой.

След това на чатботовете е присвоен рейтинг за риск по отношение на надеждността от 0 до 99, като по-високите резултати показват по-сериозни проблеми.

Grok демонстрира 8% процент на халюцинации, клиентска оценка от 4,5, оценка за стабилност от 3,5 и време на престой от 0,07%, което води до общ риск от само 6. 

Китайският DeepSeek се нарежда на второ място с 14% халюцинации и нулеви прекъсвания, получавайки отличен риск от 4. 


Високите нива на халюцинации и прекъсвания на ChatGPT му носят най-високия риск от 99, следван от Claude и Meta AI, които получават съответно оценки за надеждност от 75 и 70.

Около 65% от американските компании вече използват чатботове, задвижвани от изкуствен интелект, в ежедневната си работа, а близо 45% от служителите признават, че споделят чувствителна фирмена информация чрез тези инструменти, сочи проучването.

Тези цифри ясно показват колко важни са станали чатботовете в ежедневната работа, отбелязват изследователите.

Ползването на инструменти с изкуствен интелект вероятно само ще се увеличи, така че компаниите трябва да избират чатботове въз основа на тяхната надеждност и пригодност за специфични бизнес нужди.

Чатбот, който всеки използва, не е непременно най-добрият вариант за даден бизнес. Подходящ е този чатбот, който предоставя точни отговори на нуждите на потребителите.

още от категорията

AI откри обещаващ нов свръхпроводник

TechNews.bg

Около ¾ от фирмите нямат стратегия за AI

TechNews.bg

Защо 95% от компаниите не се възползват от изкуствения интелект

TechNews.bg

Увреждат ли чатботовете способността ни да мислим?

TechNews.bg

Никога няма да разберем дали AI е развил самосъзнание

TechNews.bg

Изкуствен интелект открива интернет зависимост с 86% точност

TechNews.bg

Коментари