TechNews.bg
Водещи новиниИзкуствен интелектНоваторскиНовини

Кой чатбот халюцинира най-малко? Изненада в нова класация

Оказва се, че най-популярният изкуствен интелект не е най-точният

Чатботовете често халюцинират, независимо колко популярни са (графика: CC0 Public Domain)

Халюцинациите на изкуствения интелект са често явление. За разработчиците на чатботове решаването на този проблем все още е предизвикателство, а някои ще имат повече работа за вършене, показа нова класация.

Grok, създаден от AI екипа на Илон Мъск, е признат за най-точния чатбот, с най-малко халюцинации при използване на работното място, докато ChatGPT и Gemini се нареждат близо до дъното в последната класация на Relum. Това е донякъде изненадващо, тъй като Grok не е най-популярният чатбот.

Победителят в рейтинга демонстрира най-ниския процент на фалшиви аларми от 10 водещи тествани AI модела. Grok хюлицинира само в 8% от случаите, което все пак не е никак малко и показва нуждата от сериозно усъвършенстване на чатботовете.

За сравнение, най-популярният чатбот ChatGPT на OpenAI демонстрира един от най-високите проценти на фалшиви аларми – 35%, като след него е единствено Gemini на Google, който има 38% халюцинации.

Проучването, проведено от Relum през декември, оценява чатботовете въз основа на показатели като процент на халюцинации, рейтинг от потребителите, последователност на отговорите и време на престой.

След това на чатботовете е присвоен рейтинг за риск по отношение на надеждността от 0 до 99, като по-високите резултати показват по-сериозни проблеми.

Grok демонстрира 8% процент на халюцинации, клиентска оценка от 4,5, оценка за стабилност от 3,5 и време на престой от 0,07%, което води до общ риск от само 6. 

Китайският DeepSeek се нарежда на второ място с 14% халюцинации и нулеви прекъсвания, получавайки отличен риск от 4. 

Високите нива на халюцинации и прекъсвания на ChatGPT му носят най-високия риск от 99, следван от Claude и Meta AI, които получават съответно оценки за надеждност от 75 и 70.

Около 65% от американските компании вече използват чатботове, задвижвани от изкуствен интелект, в ежедневната си работа, а близо 45% от служителите признават, че споделят чувствителна фирмена информация чрез тези инструменти, сочи проучването.

Тези цифри ясно показват колко важни са станали чатботовете в ежедневната работа, отбелязват изследователите.

Ползването на инструменти с изкуствен интелект вероятно само ще се увеличи, така че компаниите трябва да избират чатботове въз основа на тяхната надеждност и пригодност за специфични бизнес нужди.

Чатбот, който всеки използва, не е непременно най-добрият вариант за даден бизнес. Подходящ е този чатбот, който предоставя точни отговори на нуждите на потребителите.

още от категорията

Meta готви нова серия съкращения „заради AI”

TechNews.bg

Кои професии се променят най-много заради AI?

TechNews.bg

Сам Алтман: Изкуственият интелект нарушава баланса труд-капитал

TechNews.bg

AI трябваше да улесни работата на хората, но стана обратното

TechNews.bg

Meta отлага обещаващия AI модел „Avocado“ за май

TechNews.bg

AI еуфорията може да ни попречи да видим реалността добре

TechNews.bg

Коментари