TechNews.bg
Водещи новиниИзкуствен интелектНоваторскиНовини

Изследване разкри сериозен недостатък на GPT моделите

Изкуственият интелект е склонен да „решава“ грешни математически задачи

AI моделите могат да създават убедителни, но напълно грешни доказателства (снимка: CC0 Public Domain)

Популярните GPT модели са склонни да „решават“ грешни математически задачи, разкри първият в света сравнителен тест, който системно оценява склонността на големите езикови модели (LLMs) към сляпо съгласие (sycophancy) при решаване и доказване на математически твърдения.


Тестът BrokenMath, изготвен от екип на INSAIT – институт към Софийския университет „Св. Климент Охридски“ и ETH Цюрих – разкрива важен недостатък на съвременните модели за изкуствен интелект: те често уверено се съгласяват с грешни твърдения, вместо да ги опровергаят.

В математиката това означава, че моделите могат да създават убедителни, но напълно грешни доказателства, което поставя под съмнение тяхната надеждност при научни и образователни приложения.

Резултатите показват, че дори GPT-5 „доказва“ неверни твърдения в около 29% от случаите. Колкото по-сложна е задачата, толкова по-голяма е вероятността моделът да се подведе.

Тествани са различни подходи за ограничаване на този ефект — като промени в начина на задаване на въпросите, агентно разсъждение и допълнително обучение — но засега нито един не решава проблема.


Подобно поведение може да е опасно в контекста на нарастващото навлизане на AI в образованието. Ако системи, използвани от ученици или преподаватели, уверено представят грешни решения като верни, това би могло да доведе до натрупване на погрешни знания и подкопаване на критичното мислене.

Затова надеждността и проверката на фактите са ключови за безопасното прилагане на технологиите за изкуствен интелект в учебния процес и научните изследвания.

Изследването е проведено от Иво Петров (докторант в INSAIT), Джаспър Деконинк (ETH Zurich) и проф. Мартин Вечев (научен директор на INSAIT), уточниха от института.

още от категорията

INSAIT създаде най-голямата в света отворена 3D база данни за AI

TechNews.bg

Ще одитират обществените поръчки с изкуствен интелект

TechNews.bg

INSAIT жъне успехи в изкуствения интелект за роботи

TechNews.bg

Българска разработка ще участва на топ конференция за роботи в Сеул

TechNews.bg

Google направи поредно дарение на института INSAIT

TechNews.bg

INSAIT ще разработва AI технологии за vivo

TechNews.bg

Коментари