Водещи новини Изкуствен интелект Новаторски Новини

Кой чатбот халюцинира най-малко? Изненада в нова класация

Оказва се, че най-популярният изкуствен интелект не е най-точният

от TechNews.bg25/12/202529/12/2025

Чатботовете често халюцинират, независимо колко популярни са (графика: CC0 Public Domain)

Халюцинациите на изкуствения интелект са често явление. За разработчиците на чатботове решаването на този проблем все още е предизвикателство, а някои ще имат повече работа за вършене, показа нова класация.

Grok, създаден от AI екипа на Илон Мъск, е признат за най-точния чатбот, с най-малко халюцинации при използване на работното място, докато ChatGPT и Gemini се нареждат близо до дъното в последната класация на Relum. Това е донякъде изненадващо, тъй като Grok не е най-популярният чатбот.

Победителят в рейтинга демонстрира най-ниския процент на фалшиви аларми от 10 водещи тествани AI модела. Grok хюлицинира само в 8% от случаите, което все пак не е никак малко и показва нуждата от сериозно усъвършенстване на чатботовете.

За сравнение, най-популярният чатбот ChatGPT на OpenAI демонстрира един от най-високите проценти на фалшиви аларми – 35%, като след него е единствено Gemini на Google, който има 38% халюцинации.

Проучването, проведено от Relum през декември, оценява чатботовете въз основа на показатели като процент на халюцинации, рейтинг от потребителите, последователност на отговорите и време на престой.

След това на чатботовете е присвоен рейтинг за риск по отношение на надеждността от 0 до 99, като по-високите резултати показват по-сериозни проблеми.

Grok демонстрира 8% процент на халюцинации, клиентска оценка от 4,5, оценка за стабилност от 3,5 и време на престой от 0,07%, което води до общ риск от само 6.

Китайският DeepSeek се нарежда на второ място с 14% халюцинации и нулеви прекъсвания, получавайки отличен риск от 4.

Високите нива на халюцинации и прекъсвания на ChatGPT му носят най-високия риск от 99, следван от Claude и Meta AI, които получават съответно оценки за надеждност от 75 и 70.

Около 65% от американските компании вече използват чатботове, задвижвани от изкуствен интелект, в ежедневната си работа, а близо 45% от служителите признават, че споделят чувствителна фирмена информация чрез тези инструменти, сочи проучването.

Тези цифри ясно показват колко важни са станали чатботовете в ежедневната работа, отбелязват изследователите.

Ползването на инструменти с изкуствен интелект вероятно само ще се увеличи, така че компаниите трябва да избират чатботове въз основа на тяхната надеждност и пригодност за специфични бизнес нужди.

Чатбот, който всеки използва, не е непременно най-добрият вариант за даден бизнес. Подходящ е този чатбот, който предоставя точни отговори на нуждите на потребителите.

предишна статия

Кой чатбот халюцинира най-малко? Изненада в нова класация

Оказва се, че най-популярният изкуствен интелект не е най-точният

TechNews.bg

Коментари

Прогноза: AI балонът няма да се спука, но ще „спихне“

InfoSec SEE 2026: Предизвикателства към сигурността в ерата на AI

Киберзащита 2026: трябва да сме като Кевин от „Сам вкъщи“

InfoSec SEE 2026 очерта нова бизнес-роля: директор по използване на AI

Ново предизвикателство: заплаха ли е агентният AI за бизнеса?

От кулоарите на InfoSec SEE 2026: Как „vibe coding“ променя света на киберсигурността

За едни Първи юни носи радост, за други тишина – заедно можем да променим тази история

AI агентите могат да превърнат задачите в дигитално бедствие

Huawei очаква да завладее една трета от пазара с HarmonyOS

Първият електрически Volkswagen GTI: мощност 226 к.с. и над 400 км пробег

CAPTCHA проверките преминават към цялостен поведенчески анализ

Huawei добавя още един цвят в отворените слушалки FreeClip 2

Авиокомпании по целия свят преминават към Starlink

Въглищните електроцентрали тихомълком вредят на слънчевите панели

AI помогна за хакване на „непроницаемата“ MacOS само за 5 дни

AI не си измисля пристрастия – той ги наследява от данните

Литиево-серни батерии с удвоена плътност обещават по-издръжливи дронове

Дестилирана класика и непреходна елегантност: iPhone 17e

Спокойствие и сигурен достъп – три смарт ключалки WELOCK

Литиевите батерии се оказаха по-опасни, отколкото се смяташе

Linux компютри са пробити от хакери в продължение на 9 години

HONOR 600 Pro и HONOR 600 от A1 – в комплект с безжични слушалки и на специална цена

А1 приема предварителни поръчки за новия OPPO Find X9 Ultra

Huawei добавя още един цвят в отворените слушалки FreeClip 2

Идва нова вълна в лаптопите: Googlebook с Android

ElevenMusic – това AI приложение композира песни по текстови описания

SofiaBus – безплатно приложение за градския транспорт в столицата

още от категорията

Коментари