TechNews.bg
Водещи новиниНоваторскиНовиниРоботиТоп новини

Стъпка към Терминатор: робот програмира себе си и друг робот

Изкуственият интелект съкращава 20 пъти кодирането на системата

Истинският тест за AI роботите ще бъде как се справят с враждебни среди (графика: CC0 Public Domain)

Известен учен показа, че роботите могат да програмират мозъците си един на друг с помощта на изкуствен интелект. Това е стъпка към „Терминатор”, изграден 20 пъти по-бързо, отколкото хората могат да програмират.

Компютърният учен Питър Бърк демонстрира, че робот може да програмира собствения си мозък, използвайки генеративни модели на изкуствен интелект и да хоства хардуер, ако е правилно подтикнат от операторите.

Проектът, обяснява той в предпечатна статия, публикувана в Arxiv.org, е стъпка към „Терминатор” с Арнолд Шварценегер, където роботите стават самоосъзнати и завладяват света. „В тази статия правим първа стъпка в тази посока: Робот (машина за писане на код с изкуствен интелект) създава от нулата, с минимална човешка намеса, мозъка на друг робот – дрон”, казва ученият.

Бърк, професор по електротехника и компютърни науки в Калифорнийския университет в Ървайн, изчаква края на статията си, за да изрази надежда, че „резултатът от „Терминатор” никога няма да се случи”. Въпреки нарастващия военен интерес към изкуствения интелект, този сценарий в развитието на роботите не е непременно даденост.

Статията, коментирана от The Register, e озаглавена „Робот изгражда мозък на робот: Генерирана от изкуствен интелект станция за командване и управление на дрон, разположена в небето” и е в процес на преглед от научното издание Science Robotics.

В нея се използват две специфични дефиниции за думата „робот”, описващи различни генеративни модели на изкуствен интелект, работещи на локален лаптоп и в облака. AI програмира другия робот – дрон, оборудван със сървър Raspberry Pi Zero 2 W, предназначен да изпълнява кода на системата за управление.

Обикновено системата за управление (GCS) работи на наземно базиран компютър, който е достъпен за оператора и управлява дроновете чрез безжична телеметрична връзка. Mission Planner и QGroundControl са примери за този вид софтуер.

Системата GCS, както я описва Бърк, е междинен мозък, който извършва картографиране в реално време, планиране на мисии и конфигурация на дронове. Мозъкът от по-ниско ниво е фърмуерът на дрона (напр. Ardupilot), а мозъкът от по-високо ниво е операционната система за роботи (ROS) или някакъв друг код, който се грижи за избягване на сблъсъци. Може да участва и човек-пилот.

Това, което Бърк показва, е, че генеративните модели с изкуствен интелект могат да бъдат подканени да напишат целия код, необходим за създаване на самостоятелно хоствана система за управление на дрона (GCS) в реално време – или по-скоро WebGCS, защото кодът управлява уеб сървър Flask на картата Raspberry Pi Zero 2 W на дрона. По този начин дронът хоства собствен уебсайт за управление, създаден от изкуствен интелект, достъпен през интернет, докато е във въздуха.

Проектът включва серия от „спринтове” на различни модели на изкуствен интелект (Claude, Gemini, ChatGPT) и IDE за изкуствен интелект (VS Code, Cursor, Windsurf), всеки от които играе известна роля в имплементирането на развиващ се набор от възможности.



Първоначалният спринт, например, се фокусира върху кодирането на наземна GCS, използвайки Claude в браузъра, със следните подкани:

Подкана: Напишете Python програма, която да изпраща MAVLink команди към контролер на полета на Raspberry Pi. Кажете на дрона да излети и да се задържи на 15 метра.

Подкана: Създайте уебсайт на Pi с бутон, върху който да щракнете, за да накарате дрона да излети и да се задържи.

Подкана: Сега добавете функционалност към уеб страницата. Добавете карта с местоположението на дрона върху нея. Използвайте GPS съобщенията на MAVLink, за да поставите дрона на картата.

Подкана: Сега добавете следната функционалност към уеб страницата: потребителят може да кликне върху картата и уеб страницата ще запише GPS координатите на местоположението на картата, където потребителят е кликнал. След това ще изпрати команда за полет в „направляван режим” през MAVLink към дрона.

Подкана: Създайте един .sh файл, за да извършите цялата инсталация, включително създаване на файлове и структури на директории.

Спринтът започва добре, но след около дузина подкани моделът спира да работи, защото разговорът (серията от подкани и отговори) изразходва повече токени, отколкото контекстният прозорец на Claude позволява.

Последващите опити с Gemini 2.5 и Cursor се сблъскват с проблеми. Сесията с Gemini е провалена от грешки в скриптовете на bash shell. Сесията с Cursor води до функционален прототип, но разработчиците е трябвало да рефакторират, за да разделят проекта на части, достатъчно малки, за да се съобразят с ограниченията на контекста на модела.

Четвъртият спринт, използващ Windsurf, най-накрая е успешен. Генерираният от изкуствен интелект WebGCS отнема около 100 часа човешки труд в продължение на 2,5 седмици и води до 10 000 реда код.

Това е около 20 пъти по-малко часове, отколкото са били необходими за създаване на сравним проект, наречен Cloudstation, който Бърк и шепа студенти разработиха през последните четири години.

Едно от наблюденията в статията е, че настоящите модели на изкуствен интелект не могат да обработват много повече от 10 000 реда код. Бърк цитира скорошно проучване (С. Рандо и др.) по този въпрос, което установи, че точността на Claude 3.5 Sonnet на LongSWEBench намалява от 29% на 3%, когато дължината на контекста се увеличава от 32K на 256K токена. Неговият опит е в съответствие с откритията на Рандо, приемайки, че един ред код е еквивалентен на 10 токена.

Ханц Феври, изпълнителен директор на компанията за пространствени данни Geolava, намира проекта за дрон за завладяващ. „Идеята за система от дронове, която автономно изгражда собствен команден и контролен център чрез генеративен изкуствен интелект, е не само амбициозна, но и силно съобразена с посоката, в която се движи граничният пространствен интелект”, казва той. „Въпреки това, силно вярвам, че трябва да има строги проверки и граници за безопасност”.

Статията на проф. Бърк отбелязва, че по време на проекта за дрон е бил поддържан резервен предавател под човешки контрол, в случай че се наложи ръчно управление.

Въз основа на опита си в управлението на Geolava, Феври смята, че появата на този вид системи бележи промяна в бизнеса с изображения, заснети от въздуха.

„Въздушните изображения стават радикално по-достъпни”, казва той. „Автономното заснемане вече не е лукс, а основа за пространствен изкуствен интелект, независимо дали от дронове, стратосфера или заснемане от ниска околоземна орбита (LEO)”.

Системи като описаната в статията са само бегъл поглед към това, което предстои, където сензорните процеси, планирането и разсъжденията се сливат в почти реално време. Дори частично автоматизирани платформи като Skydio вече променят начина, по който се усещат и разбират среди, коментира Феври.

Според него, истинският тест ще бъде колко добре генеративните системи с изкуствен интелект могат да се справят с враждебни или двусмислени среди.

„Едно е да се изгради контролен цикъл в симулация или с предварителни предположения. Друго е да се адаптираш, когато теренът, целите на мисията или топологията на системата се променят по време на полет. Но дългосрочните последици са значителни: този вид работа предвещава обобщаема автономност, а не само роботика, специфична за задачите”, казва Феври.

Оставяме ви с думите на Джон Конър от „Терминатор 3: Възходът на машините”: „Бъдещето не е написано. Няма съдба освен тази, която сами си създаваме”.

още от категорията

Боен робот демонстрира ритници в стил Брус Лий

TechNews.bg

Роботи помагат за сглобяване на артефакти от древния Помпей

TechNews.bg

Новият хуманоиден робот Phybot M1 впечатли със задно салто

TechNews.bg

Илон Мъск: роботите ще премахнат бедността

TechNews.bg

Илон Мъск обеща достъпни роботи-хирурзи за всеки

TechNews.bg

Роботи, задвижвани от AI, се провалят в тестовете за безопасност

TechNews.bg

Коментари