Стъпка към Терминатор: робот програмира себе си и друг робот

Истинският тест за AI роботите ще бъде как се справят с враждебни среди (графика: CC0 Public Domain)

Известен учен показа, че роботите могат да програмират мозъците си един на друг с помощта на изкуствен интелект. Това е стъпка към „Терминатор”, изграден 20 пъти по-бързо, отколкото хората могат да програмират.

Компютърният учен Питър Бърк демонстрира, че робот може да програмира собствения си мозък, използвайки генеративни модели на изкуствен интелект и да хоства хардуер, ако е правилно подтикнат от операторите.

Проектът, обяснява той в предпечатна статия, публикувана в Arxiv.org, е стъпка към „Терминатор” с Арнолд Шварценегер, където роботите стават самоосъзнати и завладяват света. „В тази статия правим първа стъпка в тази посока: Робот (машина за писане на код с изкуствен интелект) създава от нулата, с минимална човешка намеса, мозъка на друг робот – дрон”, казва ученият.

Бърк, професор по електротехника и компютърни науки в Калифорнийския университет в Ървайн, изчаква края на статията си, за да изрази надежда, че „резултатът от „Терминатор” никога няма да се случи”. Въпреки нарастващия военен интерес към изкуствения интелект, този сценарий в развитието на роботите не е непременно даденост.

Статията, коментирана от The Register, e озаглавена „Робот изгражда мозък на робот: Генерирана от изкуствен интелект станция за командване и управление на дрон, разположена в небето” и е в процес на преглед от научното издание Science Robotics.

В нея се използват две специфични дефиниции за думата „робот”, описващи различни генеративни модели на изкуствен интелект, работещи на локален лаптоп и в облака. AI програмира другия робот – дрон, оборудван със сървър Raspberry Pi Zero 2 W, предназначен да изпълнява кода на системата за управление.

Обикновено системата за управление (GCS) работи на наземно базиран компютър, който е достъпен за оператора и управлява дроновете чрез безжична телеметрична връзка. Mission Planner и QGroundControl са примери за този вид софтуер.

Системата GCS, както я описва Бърк, е междинен мозък, който извършва картографиране в реално време, планиране на мисии и конфигурация на дронове. Мозъкът от по-ниско ниво е фърмуерът на дрона (напр. Ardupilot), а мозъкът от по-високо ниво е операционната система за роботи (ROS) или някакъв друг код, който се грижи за избягване на сблъсъци. Може да участва и човек-пилот.

Това, което Бърк показва, е, че генеративните модели с изкуствен интелект могат да бъдат подканени да напишат целия код, необходим за създаване на самостоятелно хоствана система за управление на дрона (GCS) в реално време – или по-скоро WebGCS, защото кодът управлява уеб сървър Flask на картата Raspberry Pi Zero 2 W на дрона. По този начин дронът хоства собствен уебсайт за управление, създаден от изкуствен интелект, достъпен през интернет, докато е във въздуха.

Проектът включва серия от „спринтове” на различни модели на изкуствен интелект (Claude, Gemini, ChatGPT) и IDE за изкуствен интелект (VS Code, Cursor, Windsurf), всеки от които играе известна роля в имплементирането на развиващ се набор от възможности.

Първоначалният спринт, например, се фокусира върху кодирането на наземна GCS, използвайки Claude в браузъра, със следните подкани:

Подкана: Напишете Python програма, която да изпраща MAVLink команди към контролер на полета на Raspberry Pi. Кажете на дрона да излети и да се задържи на 15 метра.

Подкана: Създайте уебсайт на Pi с бутон, върху който да щракнете, за да накарате дрона да излети и да се задържи.

Подкана: Сега добавете функционалност към уеб страницата. Добавете карта с местоположението на дрона върху нея. Използвайте GPS съобщенията на MAVLink, за да поставите дрона на картата.

Подкана: Сега добавете следната функционалност към уеб страницата: потребителят може да кликне върху картата и уеб страницата ще запише GPS координатите на местоположението на картата, където потребителят е кликнал. След това ще изпрати команда за полет в „направляван режим” през MAVLink към дрона.

Подкана: Създайте един .sh файл, за да извършите цялата инсталация, включително създаване на файлове и структури на директории.

Спринтът започва добре, но след около дузина подкани моделът спира да работи, защото разговорът (серията от подкани и отговори) изразходва повече токени, отколкото контекстният прозорец на Claude позволява.

Последващите опити с Gemini 2.5 и Cursor се сблъскват с проблеми. Сесията с Gemini е провалена от грешки в скриптовете на bash shell. Сесията с Cursor води до функционален прототип, но разработчиците е трябвало да рефакторират, за да разделят проекта на части, достатъчно малки, за да се съобразят с ограниченията на контекста на модела.

Четвъртият спринт, използващ Windsurf, най-накрая е успешен. Генерираният от изкуствен интелект WebGCS отнема около 100 часа човешки труд в продължение на 2,5 седмици и води до 10 000 реда код.

Това е около 20 пъти по-малко часове, отколкото са били необходими за създаване на сравним проект, наречен Cloudstation, който Бърк и шепа студенти разработиха през последните четири години.

Едно от наблюденията в статията е, че настоящите модели на изкуствен интелект не могат да обработват много повече от 10 000 реда код. Бърк цитира скорошно проучване (С. Рандо и др.) по този въпрос, което установи, че точността на Claude 3.5 Sonnet на LongSWEBench намалява от 29% на 3%, когато дължината на контекста се увеличава от 32K на 256K токена. Неговият опит е в съответствие с откритията на Рандо, приемайки, че един ред код е еквивалентен на 10 токена.

Ханц Феври, изпълнителен директор на компанията за пространствени данни Geolava, намира проекта за дрон за завладяващ. „Идеята за система от дронове, която автономно изгражда собствен команден и контролен център чрез генеративен изкуствен интелект, е не само амбициозна, но и силно съобразена с посоката, в която се движи граничният пространствен интелект”, казва той. „Въпреки това, силно вярвам, че трябва да има строги проверки и граници за безопасност”.

Статията на проф. Бърк отбелязва, че по време на проекта за дрон е бил поддържан резервен предавател под човешки контрол, в случай че се наложи ръчно управление.

Въз основа на опита си в управлението на Geolava, Феври смята, че появата на този вид системи бележи промяна в бизнеса с изображения, заснети от въздуха.

„Въздушните изображения стават радикално по-достъпни”, казва той. „Автономното заснемане вече не е лукс, а основа за пространствен изкуствен интелект, независимо дали от дронове, стратосфера или заснемане от ниска околоземна орбита (LEO)”.

Системи като описаната в статията са само бегъл поглед към това, което предстои, където сензорните процеси, планирането и разсъжденията се сливат в почти реално време. Дори частично автоматизирани платформи като Skydio вече променят начина, по който се усещат и разбират среди, коментира Феври.

Според него, истинският тест ще бъде колко добре генеративните системи с изкуствен интелект могат да се справят с враждебни или двусмислени среди.

„Едно е да се изгради контролен цикъл в симулация или с предварителни предположения. Друго е да се адаптираш, когато теренът, целите на мисията или топологията на системата се променят по време на полет. Но дългосрочните последици са значителни: този вид работа предвещава обобщаема автономност, а не само роботика, специфична за задачите”, казва Феври.

Оставяме ви с думите на Джон Конър от „Терминатор 3: Възходът на машините”: „Бъдещето не е написано. Няма съдба освен тази, която сами си създаваме”.

Стъпка към Терминатор: робот програмира себе си и друг робот

Изкуственият интелект съкращава 20 пъти кодирането на системата

TechNews.bg

Коментари

Индия привлича облачни доставчици с 20-годишни данъчни облекчения

България е в Топ 5 по производителност на мобилния стрийминг

Поколението „Z“ повече се поддава на фишинг

Хакерите могат да ви шпионират за секунди – през слушалките

Няма пари за нови AI центрове: Oracle може да съкрати 30 000 души

AOC Q24B36X и Q27B36X – QHD монитори на 144 Hz за дома...

Ще стане ли RAM паметта по-скъпа от златото?

От 40 долара на час: наемат писатели да обучават чатбот

Хуманоидният робот Optimus се учи, докато ни наблюдава

Процесорите EPYC навлизат все повече в клауд инфраструктурата

Индия привлича облачни доставчици с 20-годишни данъчни облекчения

NetIXстава ключов партньор на Vodafone в Гърция

Пръстен за показалеца заменя мишката?

България е в Топ 5 по производителност на мобилния стрийминг

Google награди INSAIT с 500 хиляди щатски долара

Какво е важно при избора на смарт ключалка: решенията на WELOCK

Видеоконференциите стават по-интелигентни: Logitech Rally AI

Хакерите могат да ви шпионират за секунди – през слушалките

Безплатният Wi-Fi в кафенето – какви са рисковете

AOC Q24B36X и Q27B36X – QHD монитори на 144 Hz за дома и офиса

Пръстен за показалеца заменя мишката?

Спестете много и работете интелигентно: доживотен MS Office 2021 за €31 и Windows 11 за €13

A1 стартира предварителни поръчки на HONOR Magic8 Pro

Правен интелект – AI помощник с решения на всички съдилища

SOS Universal – Android приложение за спешна помощ

още от категорията

Коментари