TechNews.bg
Водещи новиниИзкуствен интелектНоваторскиНовини

Изследване разкри сериозен недостатък на GPT моделите

Изкуственият интелект е склонен да „решава“ грешни математически задачи

AI моделите могат да създават убедителни, но напълно грешни доказателства (снимка: CC0 Public Domain)

Популярните GPT модели са склонни да „решават“ грешни математически задачи, разкри първият в света сравнителен тест, който системно оценява склонността на големите езикови модели (LLMs) към сляпо съгласие (sycophancy) при решаване и доказване на математически твърдения.


Тестът BrokenMath, изготвен от екип на INSAIT – институт към Софийския университет „Св. Климент Охридски“ и ETH Цюрих – разкрива важен недостатък на съвременните модели за изкуствен интелект: те често уверено се съгласяват с грешни твърдения, вместо да ги опровергаят.

В математиката това означава, че моделите могат да създават убедителни, но напълно грешни доказателства, което поставя под съмнение тяхната надеждност при научни и образователни приложения.

Резултатите показват, че дори GPT-5 „доказва“ неверни твърдения в около 29% от случаите. Колкото по-сложна е задачата, толкова по-голяма е вероятността моделът да се подведе.

Тествани са различни подходи за ограничаване на този ефект — като промени в начина на задаване на въпросите, агентно разсъждение и допълнително обучение — но засега нито един не решава проблема.


Подобно поведение може да е опасно в контекста на нарастващото навлизане на AI в образованието. Ако системи, използвани от ученици или преподаватели, уверено представят грешни решения като верни, това би могло да доведе до натрупване на погрешни знания и подкопаване на критичното мислене.

Затова надеждността и проверката на фактите са ключови за безопасното прилагане на технологиите за изкуствен интелект в учебния процес и научните изследвания.

Изследването е проведено от Иво Петров (докторант в INSAIT), Джаспър Деконинк (ETH Zurich) и проф. Мартин Вечев (научен директор на INSAIT), уточниха от института.

още от категорията

Ще одитират обществените поръчки с изкуствен интелект

TechNews.bg

INSAIT жъне успехи в изкуствения интелект за роботи

TechNews.bg

Българска разработка ще участва на топ конференция за роботи в Сеул

TechNews.bg

Google направи поредно дарение на института INSAIT

TechNews.bg

INSAIT ще разработва AI технологии за vivo

TechNews.bg

България става дом на една от шестте фабрики на ЕС за изкуствен интелект

TechNews.bg

Коментари