Анализи Водещи новини Изкуствен интелект Новаторски Новини Топ новини

Съмнения за бъдещето на AI: халюцинациите се увеличават

от TechNews.bg12/05/202513/05/2025

Грешките ще останат неразделна част от работата на големите езикови модели
(снимка: CC0 Public Domain)

Големите езикови модели (LLM) показват тревожно увеличение на грешките в последните си актуализации, въпреки твърденията на разработчиците за напредък. Това поставя под съмнение бъдещето на изкуствения интелект.

Доклад на OpenAI, публикуван през април, установи, че моделите o3 и o4-mini са халюцинирали съответно в 33% и 48% от случаите. За сравнение, моделът o1, пуснат в края на 2024 г., е грешал само в 16% от случаите.

Подобни данни предоставя и рейтинговата платформа Vectara: моделът DeepSeek-R1 с „подобрен логически извод” демонстрира двуцифрено увеличение на халюцинациите, отбелязва New Scientist.

OpenAI отрича връзката между актуализациите на логическите изводи и увеличаването на грешките. Представители на компанията уверяват, че работят за намаляване на халюцинациите в настоящите версии на своите LLM.

Експертите обаче се съмняват в ефективността на актуалните AI модели. Например, рейтингът Vectara, който оценява съгласуваността при обобщаване на текстове, установи, че моделите със и без логически извод имат почти еднакви нива на халюцинации.

Все пак, както отбеляза Форест Шенг Бао от Vectara, много от грешките на DeepSeek-R1 са били „безобидни” – логически правилни, но не са присъствали в оригиналните документи.

Емили Бендър от Вашингтонския университет критикува самия термин „халюцинации”, наричайки го „антропоморфизация на машини”. „LLM не разбират смисъла – те предсказват следващата дума въз основа на статистика”, подчертава тя.

Арвинд Нараянан от Принстънския университет смята, че проблемът е по-широк: AI моделите използват остарели данни и ненадеждни източници. Увеличаването на обема на данните за обучение не решава проблема с надеждността, категоричен е той.

Препоръките на изследователите се свеждат до предпазливост. Нараянан предлага да използваме LLM само там, където проверката на отговора отнема по-малко време, отколкото самостоятелното търсене.

Бендър съветва напълно да се откажем от използването на чатботове за получаване на факти. „Тези системи не са предназначени да генерират знания – те имитират реч”, казва тя.

Ситуацията поставя под въпрос бъдещето на LLM. Ако преди се е смятало, че халюцинациите ще изчезнат с развитието на технологията, сега експертите признават, че грешките ще останат неразделна част от работата на AI моделите.

Решението не е в коригиране на алгоритмите, а в промяна на подходите за проверка на техните заключения, смятат експертите.

предишна статия

Съмнения за бъдещето на AI: халюцинациите се увеличават

TechNews.bg

Коментари

A1 стартира работа по проекта 5G WAVEO на границата с Румъния

Най-голямата сделка в историята: SpaceX придоби xAI

ВЕИ+БССЕ = идеалният енергиен микс за центровете за данни

Важна промяна в системата за безопасност на ChatGPT

Италия и Полша са двигател на променящия се киберпазар в Европа

A1 стартира работа по проекта 5G WAVEO на границата с Румъния

Най-голямата сделка в историята: SpaceX придоби xAI

Южна Корея иска да влезе в световния AI елит

ВЕИ+БССЕ = идеалният енергиен микс за центровете за данни

В арабската пустиня: най-голямото и най-бързо влакче на ужасите в света

Важна промяна в системата за безопасност на ChatGPT

Италия и Полша са двигател на променящия се киберпазар в Европа

AOC Q24B36X и Q27B36X – QHD монитори на 144 Hz за дома...

Ще стане ли RAM паметта по-скъпа от златото?

От 40 долара на час: наемат писатели да обучават чатбот

Какво е важно при избора на смарт ключалка: решенията на WELOCK

Видеоконференциите стават по-интелигентни: Logitech Rally AI

Хакерите могат да ви шпионират за секунди – през слушалките

Безплатният Wi-Fi в кафенето – какви са рисковете

AOC Q24B36X и Q27B36X – QHD монитори на 144 Hz за дома и офиса

Пръстен за показалеца заменя мишката?

Спестете много и работете интелигентно: доживотен MS Office 2021 за €31 и Windows 11 за €13

A1 стартира предварителни поръчки на HONOR Magic8 Pro

Правен интелект – AI помощник с решения на всички съдилища

SOS Universal – Android приложение за спешна помощ

още от категорията

Коментари