TechNews.bg
Водещи новиниИзкуствен интелектНоваторскиНовини

Кой чатбот халюцинира най-малко? Изненада в нова класация

Оказва се, че най-популярният изкуствен интелект не е най-точният

Чатботовете често халюцинират, независимо колко популярни са (графика: CC0 Public Domain)

Халюцинациите на изкуствения интелект са често явление. За разработчиците на чатботове решаването на този проблем все още е предизвикателство, а някои ще имат повече работа за вършене, показа нова класация.

Grok, създаден от AI екипа на Илон Мъск, е признат за най-точния чатбот, с най-малко халюцинации при използване на работното място, докато ChatGPT и Gemini се нареждат близо до дъното в последната класация на Relum. Това е донякъде изненадващо, тъй като Grok не е най-популярният чатбот.

Победителят в рейтинга демонстрира най-ниския процент на фалшиви аларми от 10 водещи тествани AI модела. Grok хюлицинира само в 8% от случаите, което все пак не е никак малко и показва нуждата от сериозно усъвършенстване на чатботовете.

За сравнение, най-популярният чатбот ChatGPT на OpenAI демонстрира един от най-високите проценти на фалшиви аларми – 35%, като след него е единствено Gemini на Google, който има 38% халюцинации.

Проучването, проведено от Relum през декември, оценява чатботовете въз основа на показатели като процент на халюцинации, рейтинг от потребителите, последователност на отговорите и време на престой.

След това на чатботовете е присвоен рейтинг за риск по отношение на надеждността от 0 до 99, като по-високите резултати показват по-сериозни проблеми.

Grok демонстрира 8% процент на халюцинации, клиентска оценка от 4,5, оценка за стабилност от 3,5 и време на престой от 0,07%, което води до общ риск от само 6. 

Китайският DeepSeek се нарежда на второ място с 14% халюцинации и нулеви прекъсвания, получавайки отличен риск от 4. 

Високите нива на халюцинации и прекъсвания на ChatGPT му носят най-високия риск от 99, следван от Claude и Meta AI, които получават съответно оценки за надеждност от 75 и 70.

Около 65% от американските компании вече използват чатботове, задвижвани от изкуствен интелект, в ежедневната си работа, а близо 45% от служителите признават, че споделят чувствителна фирмена информация чрез тези инструменти, сочи проучването.

Тези цифри ясно показват колко важни са станали чатботовете в ежедневната работа, отбелязват изследователите.

Ползването на инструменти с изкуствен интелект вероятно само ще се увеличи, така че компаниите трябва да избират чатботове въз основа на тяхната надеждност и пригодност за специфични бизнес нужди.

Чатбот, който всеки използва, не е непременно най-добрият вариант за даден бизнес. Подходящ е този чатбот, който предоставя точни отговори на нуждите на потребителите.

още от категорията

Южна Корея иска да влезе в световния AI елит

TechNews.bg

От 40 долара на час: наемат писатели да обучават чатбот

TechNews.bg

AI в цифри: Grok Imagine генерира над 1,2 милиарда видеоклипа за месец

TechNews.bg

AI открива повече случаи на рак на гърдата, без фалшиви позитиви

TechNews.bg

Пуснаха социална мрежа за AI ботове, хората само наблюдават

TechNews.bg

Нова спънка за е-търговията: AI картинки съсипват доверието на купувачите

TechNews.bg

Коментари