TechNews.bg
Водещи новиниНоваторскиНовиниРоботиТоп новини

Стъпка към Терминатор: робот програмира себе си и друг робот

Изкуственият интелект съкращава 20 пъти кодирането на системата

Истинският тест за AI роботите ще бъде как се справят с враждебни среди (графика: CC0 Public Domain)

Известен учен показа, че роботите могат да програмират мозъците си един на друг с помощта на изкуствен интелект. Това е стъпка към „Терминатор”, изграден 20 пъти по-бързо, отколкото хората могат да програмират.

Компютърният учен Питър Бърк демонстрира, че робот може да програмира собствения си мозък, използвайки генеративни модели на изкуствен интелект и да хоства хардуер, ако е правилно подтикнат от операторите.

Проектът, обяснява той в предпечатна статия, публикувана в Arxiv.org, е стъпка към „Терминатор” с Арнолд Шварценегер, където роботите стават самоосъзнати и завладяват света. „В тази статия правим първа стъпка в тази посока: Робот (машина за писане на код с изкуствен интелект) създава от нулата, с минимална човешка намеса, мозъка на друг робот – дрон”, казва ученият.

Бърк, професор по електротехника и компютърни науки в Калифорнийския университет в Ървайн, изчаква края на статията си, за да изрази надежда, че „резултатът от „Терминатор” никога няма да се случи”. Въпреки нарастващия военен интерес към изкуствения интелект, този сценарий в развитието на роботите не е непременно даденост.

Статията, коментирана от The Register, e озаглавена „Робот изгражда мозък на робот: Генерирана от изкуствен интелект станция за командване и управление на дрон, разположена в небето” и е в процес на преглед от научното издание Science Robotics.

В нея се използват две специфични дефиниции за думата „робот”, описващи различни генеративни модели на изкуствен интелект, работещи на локален лаптоп и в облака. AI програмира другия робот – дрон, оборудван със сървър Raspberry Pi Zero 2 W, предназначен да изпълнява кода на системата за управление.

Обикновено системата за управление (GCS) работи на наземно базиран компютър, който е достъпен за оператора и управлява дроновете чрез безжична телеметрична връзка. Mission Planner и QGroundControl са примери за този вид софтуер.

Системата GCS, както я описва Бърк, е междинен мозък, който извършва картографиране в реално време, планиране на мисии и конфигурация на дронове. Мозъкът от по-ниско ниво е фърмуерът на дрона (напр. Ardupilot), а мозъкът от по-високо ниво е операционната система за роботи (ROS) или някакъв друг код, който се грижи за избягване на сблъсъци. Може да участва и човек-пилот.

Това, което Бърк показва, е, че генеративните модели с изкуствен интелект могат да бъдат подканени да напишат целия код, необходим за създаване на самостоятелно хоствана система за управление на дрона (GCS) в реално време – или по-скоро WebGCS, защото кодът управлява уеб сървър Flask на картата Raspberry Pi Zero 2 W на дрона. По този начин дронът хоства собствен уебсайт за управление, създаден от изкуствен интелект, достъпен през интернет, докато е във въздуха.

Проектът включва серия от „спринтове” на различни модели на изкуствен интелект (Claude, Gemini, ChatGPT) и IDE за изкуствен интелект (VS Code, Cursor, Windsurf), всеки от които играе известна роля в имплементирането на развиващ се набор от възможности.

Първоначалният спринт, например, се фокусира върху кодирането на наземна GCS, използвайки Claude в браузъра, със следните подкани:

Подкана: Напишете Python програма, която да изпраща MAVLink команди към контролер на полета на Raspberry Pi. Кажете на дрона да излети и да се задържи на 15 метра.

Подкана: Създайте уебсайт на Pi с бутон, върху който да щракнете, за да накарате дрона да излети и да се задържи.

Подкана: Сега добавете функционалност към уеб страницата. Добавете карта с местоположението на дрона върху нея. Използвайте GPS съобщенията на MAVLink, за да поставите дрона на картата.

Подкана: Сега добавете следната функционалност към уеб страницата: потребителят може да кликне върху картата и уеб страницата ще запише GPS координатите на местоположението на картата, където потребителят е кликнал. След това ще изпрати команда за полет в „направляван режим” през MAVLink към дрона.

Подкана: Създайте един .sh файл, за да извършите цялата инсталация, включително създаване на файлове и структури на директории.

Спринтът започва добре, но след около дузина подкани моделът спира да работи, защото разговорът (серията от подкани и отговори) изразходва повече токени, отколкото контекстният прозорец на Claude позволява.

Последващите опити с Gemini 2.5 и Cursor се сблъскват с проблеми. Сесията с Gemini е провалена от грешки в скриптовете на bash shell. Сесията с Cursor води до функционален прототип, но разработчиците е трябвало да рефакторират, за да разделят проекта на части, достатъчно малки, за да се съобразят с ограниченията на контекста на модела.

Четвъртият спринт, използващ Windsurf, най-накрая е успешен. Генерираният от изкуствен интелект WebGCS отнема около 100 часа човешки труд в продължение на 2,5 седмици и води до 10 000 реда код.

Това е около 20 пъти по-малко часове, отколкото са били необходими за създаване на сравним проект, наречен Cloudstation, който Бърк и шепа студенти разработиха през последните четири години.

Едно от наблюденията в статията е, че настоящите модели на изкуствен интелект не могат да обработват много повече от 10 000 реда код. Бърк цитира скорошно проучване (С. Рандо и др.) по този въпрос, което установи, че точността на Claude 3.5 Sonnet на LongSWEBench намалява от 29% на 3%, когато дължината на контекста се увеличава от 32K на 256K токена. Неговият опит е в съответствие с откритията на Рандо, приемайки, че един ред код е еквивалентен на 10 токена.

Ханц Феври, изпълнителен директор на компанията за пространствени данни Geolava, намира проекта за дрон за завладяващ. „Идеята за система от дронове, която автономно изгражда собствен команден и контролен център чрез генеративен изкуствен интелект, е не само амбициозна, но и силно съобразена с посоката, в която се движи граничният пространствен интелект”, казва той. „Въпреки това, силно вярвам, че трябва да има строги проверки и граници за безопасност”.

Статията на проф. Бърк отбелязва, че по време на проекта за дрон е бил поддържан резервен предавател под човешки контрол, в случай че се наложи ръчно управление.

Въз основа на опита си в управлението на Geolava, Феври смята, че появата на този вид системи бележи промяна в бизнеса с изображения, заснети от въздуха.

„Въздушните изображения стават радикално по-достъпни”, казва той. „Автономното заснемане вече не е лукс, а основа за пространствен изкуствен интелект, независимо дали от дронове, стратосфера или заснемане от ниска околоземна орбита (LEO)”.

Системи като описаната в статията са само бегъл поглед към това, което предстои, където сензорните процеси, планирането и разсъжденията се сливат в почти реално време. Дори частично автоматизирани платформи като Skydio вече променят начина, по който се усещат и разбират среди, коментира Феври.

Според него, истинският тест ще бъде колко добре генеративните системи с изкуствен интелект могат да се справят с враждебни или двусмислени среди.

„Едно е да се изгради контролен цикъл в симулация или с предварителни предположения. Друго е да се адаптираш, когато теренът, целите на мисията или топологията на системата се променят по време на полет. Но дългосрочните последици са значителни: този вид работа предвещава обобщаема автономност, а не само роботика, специфична за задачите”, казва Феври.

Оставяме ви с думите на Джон Конър от „Терминатор 3: Възходът на машините”: „Бъдещето не е написано. Няма съдба освен тази, която сами си създаваме”.

още от категорията

Хуманоидният робот Optimus се учи, докато ни наблюдава

TechNews.bg

От живи сгради до многофункционални домашни роботи – пет прогнози за 2026 г.

TechNews.bg

Светът утре: повече роботи, отколкото хора

TechNews.bg

Десетки учители преминаха обучение по програмиране на роботи

TechNews.bg

Домашен робот на LG освобождава хората от рутинните задачи

TechNews.bg

Българската индустрия внедрява все повече роботи

TechNews.bg

Коментари