Водещи новини Изкуствен интелект Новаторски Новини Топ новини

AI коригира само половината грешки в кода

от TechNews.bg11/04/202511/04/2025

Коригирането на софтуерни грешки от AI е далеч от нивото, което човек би очаквал от опитни програмисти (снимка: CC0 Public Domain)

Изкуственият интелект помага на разработчиците да пишат софтуер, но дори най-добрите модели са способни да коригират само половината грешки в кода, установи ново проучване на Microsoft Research.

Тестването на моделите с изкуствен интелект е извършено на базата на най-добрия бенчмарк SWE-bench, който измерва способността на AI системите да създават програмен код. Оказва се, че дори топ AI модели като OpenAI (o1) и Anthropic (Claude 3.7 Sonnet) се справят само с половината от грешките.

По време на експеримента на AI агентите е възложено да решат 300 задачи за премахване на грешки в кода. Лидер е моделът Claude 3.7 Sonnet, който има успеваемост от 48,4%, следван от OpenAI o1 (30,2%) и o3-mini (22,1%).

Подобна ефективност в коригирането на софтуерни грешки е далеч от нивото, което човек би очаквал от опитни програмисти. Основният проблем, според TechCrunch, е, че изкуственият интелект все още не разбира как да използва наличните инструменти и да интерпретира грешките.

Ключова пречка остава липсата на данни за обучение на моделите. „Ние силно вярваме, че обучението или преквалификацията може да ги направи [AI моделите] по-добри интерактивни програми за отстраняване на грешки”, отбелязват авторите на изследването. „Това обаче изисква специализирани данни, например верига от записи на всички процеси на взаимодействие между хора и AI дебъгери”.

В момента такива данни са недостатъчни, което ограничава възможностите на AI моделите. Например, популярният инструмент Devin от стартиращата компания Cognition Labs се справя само с три от 20 теста за кодиране именно по тази причина.

И докато AI се използва силно от компании като Google, главният изпълнителен директор на компанията Сундар Пичай казва, че една четвърт от кода, създаден с помощта на изкуствен интелект, всъщност може да въведе грешки.

Технологичните лидери са скептични относно пълната автоматизация на програмирането. Бил Гейтс е убеден, че програмирането като професия със сигурност няма да изчезне. Подобни мнения споделят главният изпълнителен директор на Replit Амджад Масад, шефът на Okta Тод Маккинън и CEO-то на IBM Арвинд Кришна.

Въпреки очевидните предизвикателства, интересът към инструментите за разработка на AI продължава да расте. Инвеститорите виждат потенциал за повишаване на ефективността, но водещи разработчици смятат, че е твърде рано да се доверят изцяло на изкуствения интелект.

предишна статия

AI коригира само половината грешки в кода

TechNews.bg

Коментари

Уличното осветление трябва да се разглежда като стратегическа инфраструктура

Mythos превъзхожда конкурентите в търсенето на уязвимости, но има слабости

Е-суверенитетът повишава възвръщаемостта от корпоративния AI

Разликата в тестването на уязвимости се разширява

AI агентите могат да превърнат задачите в дигитално бедствие

CAPTCHA проверките преминават към цялостен поведенчески анализ

За едни Първи юни носи радост, за други тишина – заедно можем да променим тази история

А1 разширява семейството на телевизионните си канали с MAX One

Western Digital внедрява защита от квантови атаки в нова серия HDD

ООН алармира за системна и екологична заплаха от изкуствения интелект

Walmart атакува: шест таблета с Android 16 на цената на един iPad...

Как Австралия инсталира 400 000 домашни батерии за 10 месеца

Без абонаментни такси: доживотен лиценз за Office 2021 от €29 и Windows...

MAX Sport ще излъчва контролите на националните ни отбори по волейбол преди...

България изгражда AI-базирана национална киберзащита в партньорство с Google

QNAP вгражда софтуерна NDR защита в NAS устройствата

Забрана за китайските соларни панели: дали пък не прекаляваме?

Дестилирана класика и непреходна елегантност: iPhone 17e

Спокойствие и сигурен достъп – три смарт ключалки WELOCK

Грешки и забавяне на интернет причинява последната актуализация на Windows 11

Повечето Android смартфони няма да се справят с Gemini AI – трябва им повече памет

Без абонаментни такси: доживотен лиценз за Office 2021 от €29 и Windows 11 от €12

Huawei Watch FIT 5 вече е в A1: интелигентен спътник за динамичното ежедневие

Walmart атакува: шест таблета с Android 16 на цената на един iPad Pro

Монитор с уникален „двоен екран” излиза на пазара

ElevenMusic – това AI приложение композира песни по текстови описания

SofiaBus – безплатно приложение за градския транспорт в столицата

още от категорията

Коментари