Водещи новини Изкуствен интелект Новаторски Новини

Изследване разкри сериозен недостатък на GPT моделите

Изкуственият интелект е склонен да „решава“ грешни математически задачи

от TechNews.bg10/10/2025

AI моделите могат да създават убедителни, но напълно грешни доказателства (снимка: CC0 Public Domain)

Популярните GPT модели са склонни да „решават“ грешни математически задачи, разкри първият в света сравнителен тест, който системно оценява склонността на големите езикови модели (LLMs) към сляпо съгласие (sycophancy) при решаване и доказване на математически твърдения.

Тестът BrokenMath, изготвен от екип на INSAIT – институт към Софийския университет „Св. Климент Охридски“ и ETH Цюрих – разкрива важен недостатък на съвременните модели за изкуствен интелект: те често уверено се съгласяват с грешни твърдения, вместо да ги опровергаят.

В математиката това означава, че моделите могат да създават убедителни, но напълно грешни доказателства, което поставя под съмнение тяхната надеждност при научни и образователни приложения.

Резултатите показват, че дори GPT-5 „доказва“ неверни твърдения в около 29% от случаите. Колкото по-сложна е задачата, толкова по-голяма е вероятността моделът да се подведе.

Тествани са различни подходи за ограничаване на този ефект — като промени в начина на задаване на въпросите, агентно разсъждение и допълнително обучение — но засега нито един не решава проблема.

Подобно поведение може да е опасно в контекста на нарастващото навлизане на AI в образованието. Ако системи, използвани от ученици или преподаватели, уверено представят грешни решения като верни, това би могло да доведе до натрупване на погрешни знания и подкопаване на критичното мислене.

Затова надеждността и проверката на фактите са ключови за безопасното прилагане на технологиите за изкуствен интелект в учебния процес и научните изследвания.

Изследването е проведено от Иво Петров (докторант в INSAIT), Джаспър Деконинк (ETH Zurich) и проф. Мартин Вечев (научен директор на INSAIT), уточниха от института.

предишна статия

Изследване разкри сериозен недостатък на GPT моделите

Изкуственият интелект е склонен да „решава“ грешни математически задачи

TechNews.bg

Коментари

Работа на 5 места дистанционно: ИТ спец печели близо милион долара годишно

Прогноза: AI балонът няма да се спука, но ще „спихне“

InfoSec SEE 2026: Предизвикателства към сигурността в ерата на AI

Киберзащита 2026: трябва да сме като Кевин от „Сам вкъщи“

InfoSec SEE 2026 очерта нова бизнес-роля: директор по използване на AI

Ново предизвикателство: заплаха ли е агентният AI за бизнеса?

За едни Първи юни носи радост, за други тишина – заедно можем да променим тази история

Разликата в тестването на уязвимости се разширява

Хибридна приливно-фотоволтаична система черпи възобновяема енергия от речни устия

Как един център за данни изгълта 113 млн. литра вода

AI агентите могат да превърнат задачите в дигитално бедствие

Huawei очаква да завладее една трета от пазара с HarmonyOS

Първият електрически Volkswagen GTI: мощност 226 к.с. и над 400 км пробег

CAPTCHA проверките преминават към цялостен поведенчески анализ

Huawei добавя още един цвят в отворените слушалки FreeClip 2

Авиокомпании по целия свят преминават към Starlink

Въглищните електроцентрали тихомълком вредят на слънчевите панели

Дестилирана класика и непреходна елегантност: iPhone 17e

Спокойствие и сигурен достъп – три смарт ключалки WELOCK

Литиевите батерии се оказаха по-опасни, отколкото се смяташе

Linux компютри са пробити от хакери в продължение на 9 години

HONOR 600 Pro и HONOR 600 от A1 – в комплект с безжични слушалки и на специална цена

А1 приема предварителни поръчки за новия OPPO Find X9 Ultra

Huawei добавя още един цвят в отворените слушалки FreeClip 2

Идва нова вълна в лаптопите: Googlebook с Android

ElevenMusic – това AI приложение композира песни по текстови описания

SofiaBus – безплатно приложение за градския транспорт в столицата

още от категорията

Коментари