Водещи новини Изкуствен интелект Новаторски Новини

Кой чатбот халюцинира най-малко? Изненада в нова класация

Оказва се, че най-популярният изкуствен интелект не е най-точният

от TechNews.bg25/12/202529/12/2025

Чатботовете често халюцинират, независимо колко популярни са (графика: CC0 Public Domain)

Халюцинациите на изкуствения интелект са често явление. За разработчиците на чатботове решаването на този проблем все още е предизвикателство, а някои ще имат повече работа за вършене, показа нова класация.

Grok, създаден от AI екипа на Илон Мъск, е признат за най-точния чатбот, с най-малко халюцинации при използване на работното място, докато ChatGPT и Gemini се нареждат близо до дъното в последната класация на Relum. Това е донякъде изненадващо, тъй като Grok не е най-популярният чатбот.

Победителят в рейтинга демонстрира най-ниския процент на фалшиви аларми от 10 водещи тествани AI модела. Grok хюлицинира само в 8% от случаите, което все пак не е никак малко и показва нуждата от сериозно усъвършенстване на чатботовете.

За сравнение, най-популярният чатбот ChatGPT на OpenAI демонстрира един от най-високите проценти на фалшиви аларми – 35%, като след него е единствено Gemini на Google, който има 38% халюцинации.

Проучването, проведено от Relum през декември, оценява чатботовете въз основа на показатели като процент на халюцинации, рейтинг от потребителите, последователност на отговорите и време на престой.

След това на чатботовете е присвоен рейтинг за риск по отношение на надеждността от 0 до 99, като по-високите резултати показват по-сериозни проблеми.

Grok демонстрира 8% процент на халюцинации, клиентска оценка от 4,5, оценка за стабилност от 3,5 и време на престой от 0,07%, което води до общ риск от само 6.

Китайският DeepSeek се нарежда на второ място с 14% халюцинации и нулеви прекъсвания, получавайки отличен риск от 4.

Високите нива на халюцинации и прекъсвания на ChatGPT му носят най-високия риск от 99, следван от Claude и Meta AI, които получават съответно оценки за надеждност от 75 и 70.

Около 65% от американските компании вече използват чатботове, задвижвани от изкуствен интелект, в ежедневната си работа, а близо 45% от служителите признават, че споделят чувствителна фирмена информация чрез тези инструменти, сочи проучването.

Тези цифри ясно показват колко важни са станали чатботовете в ежедневната работа, отбелязват изследователите.

Ползването на инструменти с изкуствен интелект вероятно само ще се увеличи, така че компаниите трябва да избират чатботове въз основа на тяхната надеждност и пригодност за специфични бизнес нужди.

Чатбот, който всеки използва, не е непременно най-добрият вариант за даден бизнес. Подходящ е този чатбот, който предоставя точни отговори на нуждите на потребителите.

предишна статия

Кой чатбот халюцинира най-малко? Изненада в нова класация

Оказва се, че най-популярният изкуствен интелект не е най-точният

TechNews.bg

Коментари

AI гигант дава умопомрачителна заплата на специалист по сделки в Европа

ЕС ограничава финансирането на проекти, използващи китайски инвертори

Илон Мъск може да спаси бизнеса на Intel с договорно производство на чипове

Да можем да сменяме батериите на телефоните – става задължително в ЕС, но…

Учени на лов за „звезди“ от тъмна материя, които имитират черни дупки

Logitech елиминира близо 170 000 тона въглеродни емисии през финансовата 2025 г.

Компактни и мощни двигатели с гъвкава конфигурация от FAULHABER

Още две държави готвят забрана на социалните мрежи за деца

Android TV Box като игрова конзола: докъде стигат емулаторите на ретро платформи

Роботите скоро ще изместят хората от складовете

Фасадите на сградите могат да произвеждат 36 GW енергия – в Нидерландия

Хвърчат глави: кризата на изкуствения интелект е вече тук?

Повече от ъпгрейд: Как Windows 11 Pro пренаписва правилата на дигиталното работно...

Компания на Бил Гейтс строи ядрен реактор от ново поколение

Китай формира патентен пул за фотоволтаични TOPCon технологии

Япония създава кризисна работна група – AI заплашва банките

Термоакустичните термопомпи чукат на вратата

Мащабиране на микромобилността: от нововъзникваща тенденция до масово приемане

За бегачи: новият Huawei Watch GT Runner 2 е тук

Honor 600 Lite е на пазара у нас – метален, с AI функции и достъпна цена

Android TV Box като игрова конзола: докъде стигат емулаторите на ретро платформи

Повече от ъпгрейд: Как Windows 11 Pro пренаписва правилата на дигиталното работно място през 2026 г.

Доживотни версии на MS Office 2021 и Windows 11 – цени от €13

Samsung Galaxy A57 5G и Galaxy A37 5G – на лизинг от A1 с 0% лихва

Нова мрежова карта на QNAP отключва потенциала на сторидж системите

Космически SSD с фамозно име е защитен от радиация

ElevenMusic – това AI приложение композира песни по текстови описания

SofiaBus – безплатно приложение за градския транспорт в столицата

още от категорията

Коментари