TechNews.bg
Водещи новиниИзкуствен интелектНоваторскиНовиниТоп новини

AI коригира само половината грешки в кода

Коригирането на софтуерни грешки от AI е далеч от нивото, което човек би очаквал от опитни програмисти (снимка: CC0 Public Domain)

Изкуственият интелект помага на разработчиците да пишат софтуер, но дори най-добрите модели са способни да коригират само половината грешки в кода, установи ново проучване на Microsoft Research.

Тестването на моделите с изкуствен интелект е извършено на базата на най-добрия бенчмарк SWE-bench, който измерва способността на AI системите да създават програмен код. Оказва се, че дори топ AI модели като OpenAI (o1) и Anthropic (Claude 3.7 Sonnet) се справят само с половината от грешките.


По време на експеримента на AI агентите е възложено да решат 300 задачи за премахване на грешки в кода. Лидер е моделът Claude 3.7 Sonnet, който има успеваемост от 48,4%, следван от OpenAI o1 (30,2%) и o3-mini (22,1%).

Подобна ефективност в коригирането на софтуерни грешки е далеч от нивото, което човек би очаквал от опитни програмисти. Основният проблем, според TechCrunch, е, че изкуственият интелект все още не разбира как да използва наличните инструменти и да интерпретира грешките.

Ключова пречка остава липсата на данни за обучение на моделите. „Ние силно вярваме, че обучението или преквалификацията може да ги направи [AI моделите] по-добри интерактивни програми за отстраняване на грешки”, отбелязват авторите на изследването. „Това обаче изисква специализирани данни, например верига от записи на всички процеси на взаимодействие между хора и AI дебъгери”.

В момента такива данни са недостатъчни, което ограничава възможностите на AI моделите. Например, популярният инструмент Devin от стартиращата компания Cognition Labs се справя само с три от 20 теста за кодиране именно по тази причина.


И докато AI се използва силно от компании като Google, главният изпълнителен директор на компанията Сундар Пичай казва, че една четвърт от кода, създаден с помощта на изкуствен интелект, всъщност може да въведе грешки.

Технологичните лидери са скептични относно пълната автоматизация на програмирането. Бил Гейтс е убеден, че програмирането като професия със сигурност няма да изчезне. Подобни мнения споделят главният изпълнителен директор на Replit Амджад Масад, шефът на Okta Тод Маккинън и CEO-то на IBM Арвинд Кришна.

Въпреки очевидните предизвикателства, интересът към инструментите за разработка на AI продължава да расте. Инвеститорите виждат потенциал за повишаване на ефективността, но водещи разработчици смятат, че е твърде рано да се доверят изцяло на изкуствения интелект.

още от категорията

Кодът, генериран от AI, съдържа 1,7 пъти повече грешки от човешкия

TechNews.bg

7 тенденции в изкуствения интелект през 2026 г.

TechNews.bg

AI резюметата съсипват труда на кулинарните блогъри

TechNews.bg

AI не се отплаща, но компаниите увеличат разходите си за него

TechNews.bg

Тръмп наема 1000 специалисти за „Технологичната сила“

TechNews.bg

Южна Корея въвежда  всеобхватни регулации за изкуствения интелект

TechNews.bg

Коментари