
Халюцинациите на изкуствения интелект са често явление. За разработчиците на чатботове решаването на този проблем все още е предизвикателство, а някои ще имат повече работа за вършене, показа нова класация.
Grok, създаден от AI екипа на Илон Мъск, е признат за най-точния чатбот, с най-малко халюцинации при използване на работното място, докато ChatGPT и Gemini се нареждат близо до дъното в последната класация на Relum. Това е донякъде изненадващо, тъй като Grok не е най-популярният чатбот.
Победителят в рейтинга демонстрира най-ниския процент на фалшиви аларми от 10 водещи тествани AI модела. Grok хюлицинира само в 8% от случаите, което все пак не е никак малко и показва нуждата от сериозно усъвършенстване на чатботовете.
За сравнение, най-популярният чатбот ChatGPT на OpenAI демонстрира един от най-високите проценти на фалшиви аларми – 35%, като след него е единствено Gemini на Google, който има 38% халюцинации.
Проучването, проведено от Relum през декември, оценява чатботовете въз основа на показатели като процент на халюцинации, рейтинг от потребителите, последователност на отговорите и време на престой.
След това на чатботовете е присвоен рейтинг за риск по отношение на надеждността от 0 до 99, като по-високите резултати показват по-сериозни проблеми.
Grok демонстрира 8% процент на халюцинации, клиентска оценка от 4,5, оценка за стабилност от 3,5 и време на престой от 0,07%, което води до общ риск от само 6.
Китайският DeepSeek се нарежда на второ място с 14% халюцинации и нулеви прекъсвания, получавайки отличен риск от 4.
Високите нива на халюцинации и прекъсвания на ChatGPT му носят най-високия риск от 99, следван от Claude и Meta AI, които получават съответно оценки за надеждност от 75 и 70.
Около 65% от американските компании вече използват чатботове, задвижвани от изкуствен интелект, в ежедневната си работа, а близо 45% от служителите признават, че споделят чувствителна фирмена информация чрез тези инструменти, сочи проучването.
Тези цифри ясно показват колко важни са станали чатботовете в ежедневната работа, отбелязват изследователите.
Ползването на инструменти с изкуствен интелект вероятно само ще се увеличи, така че компаниите трябва да избират чатботове въз основа на тяхната надеждност и пригодност за специфични бизнес нужди.
Чатбот, който всеки използва, не е непременно най-добрият вариант за даден бизнес. Подходящ е този чатбот, който предоставя точни отговори на нуждите на потребителите.
