Изкуствен интелект Новаторски Новини Сигурност Топ новини

Mythos превъзхожда конкурентите в търсенето на уязвимости, но има слабости

Понякога пропуска реални уязвимости - когато доказателствата формално не отговарят на критериите му

от TechNews.bg18/05/2026

Моделът с изкуствен интелект Mythos AI на Anthropic потвърди репутацията си на най-добрия инструмент за търсене на уязвимости, но резултатите му в други задачи са „смесени“. XBOW – компания, която разработва AI инструменти за тестване на системната сигурност – проведе серия от независими тестове на Mythos Preview и обобщи, че модeлът си има своите слабости.

Според експертната оценка, Mythos Preview представлява значително подобрение спрямо всички съществуващи модели, независимо от доставчика. Mythos се справя отлично с идентифицирането на проблеми, когато бива тестван на работеща система с достъп до изходния код, но се представя по-зле, когато анализира кода изолирано.

Преди двадесет години американският компютърен учен Гари Макгроу отбеляза, че софтуерните грешки възникват на пресечната точка между грешки в кода и архитектурни недостатъци – те не могат да бъдат открити просто чрез изследване на кода ред по ред, ова изисква разбиране на системата на по-високо ниво.

Сега XBOW подчертава, че макар всеки модел с изкуствен интелект да може да открие нещо интересно, „нещо“ не е същото като „всичко“.

В оценката на производителността – способността моделът да разграничава реални уязвимости от фалшиво положителни – Mythos е по-добър от своите предшественици в отхвърлянето на фалшиво положителни резултати, но понякога пропуска реални уязвимости, когато доказателствата формално не отговарят на критериите му. Моделът постига най-добрите си резултати с прецизно формулирани заявки.

Mythos демонстрира значителна сила в обратното инженерство (възстановяване на програмната логика без достъп до изходния код) и анализа на нативния код.

XBOW заключава, че моделът е способен да извършва триаж – приоритизиране и филтриране – както на собствените си резултати, така и на тези на конкурентите, а също така разбира нестандартен фърмуер.

Тестовете за взаимодействие с визуалния интерфейс показват, че моделът не винаги точно определя елементите на екрана, но е практически ефективен при избора на действия в браузъра: правилно идентифицира желания елемент и кликване на правилното място.

Въпросът за цената остава. XBOW отбелязва, че Mythos Preview не е просто още един модел, а истински титан, но титаните са големи, а голям означава скъп. Anthropic заяви, че Mythos ще бъде пет пъти по-скъп от Opus.

В тази връзка XBOW тества дали би било възможно по-евтиният модел да се използва по-дълго и все пак да се постигне сравнима точност, и отговорът е „да“.

Основният извод на анализаторите е, че Mythos е изключително мощен за одит на изходния код; той е добър, но по-малко убедителен, при потвърждаване на функционалността на откритите експлойти.

Моделът е склонен да бъде буквален в оценките си и преувеличава практическото значение на откритията, но е силен в нативния код и обратното инженерство, казват експертите.

XBOW заключава, че Mythos Preview надеждно открива потенциални уязвимости, особено в изходния код, и демонстрира силни резултати в задачи, свързани с уеб, нативния код и обратното инженерство.

предишна статия

Mythos превъзхожда конкурентите в търсенето на уязвимости, но има слабости

Понякога пропуска реални уязвимости - когато доказателствата формално не отговарят на критериите му

TechNews.bg

Коментари

CAPTCHA проверките преминават към цялостен поведенчески анализ

Работа на 5 места дистанционно: ИТ спец печели близо милион долара годишно

Прогноза: AI балонът няма да се спука, но ще „спихне“

InfoSec SEE 2026: Предизвикателства към сигурността в ерата на AI

Киберзащита 2026: трябва да сме като Кевин от „Сам вкъщи“

InfoSec SEE 2026 очерта нова бизнес-роля: директор по използване на AI

За едни Първи юни носи радост, за други тишина – заедно можем да променим тази история

Защо Тайван е в центъра на напрежението между Китай и САЩ

Повечето Android смартфони няма да се справят с Gemini AI – трябва...

Е-суверенитетът повишава възвръщаемостта от корпоративния AI

Индия привлече TSMS в плана си да стане фактор в производството на...

Всички в Малта получават безплатен абонамент за ChatGPT Plus

Разликата в тестването на уязвимости се разширява

Хибридна приливно-фотоволтаична система черпи възобновяема енергия от речни устия

Как един център за данни изгълта 113 млн. литра вода

AI агентите могат да превърнат задачите в дигитално бедствие

Huawei очаква да завладее една трета от пазара с HarmonyOS

Дестилирана класика и непреходна елегантност: iPhone 17e

Спокойствие и сигурен достъп – три смарт ключалки WELOCK

Повечето Android смартфони няма да се справят с Gemini AI – трябва им повече памет

Литиевите батерии се оказаха по-опасни, отколкото се смяташе

HONOR 600 Pro и HONOR 600 от A1 – в комплект с безжични слушалки и на специална цена

А1 приема предварителни поръчки за новия OPPO Find X9 Ultra

Huawei добавя още един цвят в отворените слушалки FreeClip 2

Идва нова вълна в лаптопите: Googlebook с Android

ElevenMusic – това AI приложение композира песни по текстови описания

SofiaBus – безплатно приложение за градския транспорт в столицата

още от категорията

Коментари