Стъпка към Терминатор: робот програмира себе си и друг робот

Истинският тест за AI роботите ще бъде как се справят с враждебни среди (графика: CC0 Public Domain)

Известен учен показа, че роботите могат да програмират мозъците си един на друг с помощта на изкуствен интелект. Това е стъпка към „Терминатор”, изграден 20 пъти по-бързо, отколкото хората могат да програмират.

Компютърният учен Питър Бърк демонстрира, че робот може да програмира собствения си мозък, използвайки генеративни модели на изкуствен интелект и да хоства хардуер, ако е правилно подтикнат от операторите.

Проектът, обяснява той в предпечатна статия, публикувана в Arxiv.org, е стъпка към „Терминатор” с Арнолд Шварценегер, където роботите стават самоосъзнати и завладяват света. „В тази статия правим първа стъпка в тази посока: Робот (машина за писане на код с изкуствен интелект) създава от нулата, с минимална човешка намеса, мозъка на друг робот – дрон”, казва ученият.

Бърк, професор по електротехника и компютърни науки в Калифорнийския университет в Ървайн, изчаква края на статията си, за да изрази надежда, че „резултатът от „Терминатор” никога няма да се случи”. Въпреки нарастващия военен интерес към изкуствения интелект, този сценарий в развитието на роботите не е непременно даденост.

Статията, коментирана от The Register, e озаглавена „Робот изгражда мозък на робот: Генерирана от изкуствен интелект станция за командване и управление на дрон, разположена в небето” и е в процес на преглед от научното издание Science Robotics.

В нея се използват две специфични дефиниции за думата „робот”, описващи различни генеративни модели на изкуствен интелект, работещи на локален лаптоп и в облака. AI програмира другия робот – дрон, оборудван със сървър Raspberry Pi Zero 2 W, предназначен да изпълнява кода на системата за управление.

Обикновено системата за управление (GCS) работи на наземно базиран компютър, който е достъпен за оператора и управлява дроновете чрез безжична телеметрична връзка. Mission Planner и QGroundControl са примери за този вид софтуер.

Системата GCS, както я описва Бърк, е междинен мозък, който извършва картографиране в реално време, планиране на мисии и конфигурация на дронове. Мозъкът от по-ниско ниво е фърмуерът на дрона (напр. Ardupilot), а мозъкът от по-високо ниво е операционната система за роботи (ROS) или някакъв друг код, който се грижи за избягване на сблъсъци. Може да участва и човек-пилот.

Това, което Бърк показва, е, че генеративните модели с изкуствен интелект могат да бъдат подканени да напишат целия код, необходим за създаване на самостоятелно хоствана система за управление на дрона (GCS) в реално време – или по-скоро WebGCS, защото кодът управлява уеб сървър Flask на картата Raspberry Pi Zero 2 W на дрона. По този начин дронът хоства собствен уебсайт за управление, създаден от изкуствен интелект, достъпен през интернет, докато е във въздуха.

Проектът включва серия от „спринтове” на различни модели на изкуствен интелект (Claude, Gemini, ChatGPT) и IDE за изкуствен интелект (VS Code, Cursor, Windsurf), всеки от които играе известна роля в имплементирането на развиващ се набор от възможности.

Първоначалният спринт, например, се фокусира върху кодирането на наземна GCS, използвайки Claude в браузъра, със следните подкани:

Подкана: Напишете Python програма, която да изпраща MAVLink команди към контролер на полета на Raspberry Pi. Кажете на дрона да излети и да се задържи на 15 метра.

Подкана: Създайте уебсайт на Pi с бутон, върху който да щракнете, за да накарате дрона да излети и да се задържи.

Подкана: Сега добавете функционалност към уеб страницата. Добавете карта с местоположението на дрона върху нея. Използвайте GPS съобщенията на MAVLink, за да поставите дрона на картата.

Подкана: Сега добавете следната функционалност към уеб страницата: потребителят може да кликне върху картата и уеб страницата ще запише GPS координатите на местоположението на картата, където потребителят е кликнал. След това ще изпрати команда за полет в „направляван режим” през MAVLink към дрона.

Подкана: Създайте един .sh файл, за да извършите цялата инсталация, включително създаване на файлове и структури на директории.

Спринтът започва добре, но след около дузина подкани моделът спира да работи, защото разговорът (серията от подкани и отговори) изразходва повече токени, отколкото контекстният прозорец на Claude позволява.

Последващите опити с Gemini 2.5 и Cursor се сблъскват с проблеми. Сесията с Gemini е провалена от грешки в скриптовете на bash shell. Сесията с Cursor води до функционален прототип, но разработчиците е трябвало да рефакторират, за да разделят проекта на части, достатъчно малки, за да се съобразят с ограниченията на контекста на модела.

Четвъртият спринт, използващ Windsurf, най-накрая е успешен. Генерираният от изкуствен интелект WebGCS отнема около 100 часа човешки труд в продължение на 2,5 седмици и води до 10 000 реда код.

Това е около 20 пъти по-малко часове, отколкото са били необходими за създаване на сравним проект, наречен Cloudstation, който Бърк и шепа студенти разработиха през последните четири години.

Едно от наблюденията в статията е, че настоящите модели на изкуствен интелект не могат да обработват много повече от 10 000 реда код. Бърк цитира скорошно проучване (С. Рандо и др.) по този въпрос, което установи, че точността на Claude 3.5 Sonnet на LongSWEBench намалява от 29% на 3%, когато дължината на контекста се увеличава от 32K на 256K токена. Неговият опит е в съответствие с откритията на Рандо, приемайки, че един ред код е еквивалентен на 10 токена.

Ханц Феври, изпълнителен директор на компанията за пространствени данни Geolava, намира проекта за дрон за завладяващ. „Идеята за система от дронове, която автономно изгражда собствен команден и контролен център чрез генеративен изкуствен интелект, е не само амбициозна, но и силно съобразена с посоката, в която се движи граничният пространствен интелект”, казва той. „Въпреки това, силно вярвам, че трябва да има строги проверки и граници за безопасност”.

Статията на проф. Бърк отбелязва, че по време на проекта за дрон е бил поддържан резервен предавател под човешки контрол, в случай че се наложи ръчно управление.

Въз основа на опита си в управлението на Geolava, Феври смята, че появата на този вид системи бележи промяна в бизнеса с изображения, заснети от въздуха.

„Въздушните изображения стават радикално по-достъпни”, казва той. „Автономното заснемане вече не е лукс, а основа за пространствен изкуствен интелект, независимо дали от дронове, стратосфера или заснемане от ниска околоземна орбита (LEO)”.

Системи като описаната в статията са само бегъл поглед към това, което предстои, където сензорните процеси, планирането и разсъжденията се сливат в почти реално време. Дори частично автоматизирани платформи като Skydio вече променят начина, по който се усещат и разбират среди, коментира Феври.

Според него, истинският тест ще бъде колко добре генеративните системи с изкуствен интелект могат да се справят с враждебни или двусмислени среди.

„Едно е да се изгради контролен цикъл в симулация или с предварителни предположения. Друго е да се адаптираш, когато теренът, целите на мисията или топологията на системата се променят по време на полет. Но дългосрочните последици са значителни: този вид работа предвещава обобщаема автономност, а не само роботика, специфична за задачите”, казва Феври.

Оставяме ви с думите на Джон Конър от „Терминатор 3: Възходът на машините”: „Бъдещето не е написано. Няма съдба освен тази, която сами си създаваме”.

Стъпка към Терминатор: робот програмира себе си и друг робот

Изкуственият интелект съкращава 20 пъти кодирането на системата

TechNews.bg

Коментари

Нискочестотният спектър – тихият претендент за мрежите на бъдещето

Защо възходът на AI агентите носи нов риск за информационната сигурност

Глобалният ВЕИ капацитет ще се удвои до 8,4 TW до 2031 г.

Техническите умения се „амортизират“ все по-бързо

AI престъпленията – бизнес за 4,4 трилиона долара

Omada EAP775-Wall – първата стенна WiFi 7 точка за достъп с възможност за боядисване, съчетаваща дискретен дизайн и изключителна производителност

Kибератаките срещу енергийни инфраструктура се префокусират към САЩ

AI агентите усъвършенстват интуицията си с денонощен труд

Cabolo – AI технологията, която не използва cloud и защитава информацията още...

Samsung Galaxy S26: далновидна инвестиция, класика и комфорт

Pokémon Go възкръсва: ще обучава роботи

Нискочестотният спектър – тихият претендент за мрежите на бъдещето

Микроскопични термометри обещават по-ефективни процесори

Отново за AI балона: “Много хора забогатяха бързо и предстои рестарт”

Сформираха Глобален съвет на ръководителите по ИТ сигурността

Започват да никнат регулации за агроволтаиката

Samsung Galaxy S26: далновидна инвестиция, класика и комфорт

AOC 16T20E2 – преносим монитор за професионалисти

Ергономични офис столове за дома и офиса

SSD за дистанционна работа: опростява процеса и пести време

50 евро отстъпка дава А1 за предварителните поръчки на Nothing Phone (4a) Pro

Arsen 302BT – стилна озвучителна система за геймъри

Пролетно спестяванe: доживотни лицензи за Windows 11 и Microsoft Office 2021 от €13

Новите смартфони Galaxy S26 – на лизинг с 0% лихва от А1

YouTube for visionOS – любимите видеа вече официално и на VR очилата Apple Vision Pro

LibreOffice 26.2 – по-бърз и усъвършенстван офис пакет

още от категорията

Коментари