По-рано тази година компанията за финансови услуги Klarna заяви, че нейният агент с изкуствен интелект, захранван от технологията на OpenAI, е поел две трети от клиентските чатове и върши работа, еквивалентна на тази на 700 агенти-хора на пълен работен ден. Това се случи само след един месец употреба. Опитът на Klarna може да е първият знак, че AI агентите „имат своя ChatGPT момент”, коментира Александър Кваме, главен изпълнителен директор на стартъпа за ангажиране на клиенти Echo AI.
OpenAI пусна публична версия на AI бота ChatGPT в края на 2022 г., давайки на хората възможност да опитат как новите чатботове с генеративен изкуствен интелект (GenAI) могат да предложат много по-задълбочени, креативни и разговорни отговори на уеб заявки, в сравнение с традиционното търсене – начина, по който потребителите получават онлайн информация в последните 25 години.
Google, Microsoft и други големи играчи последваха OpenAI с конкурентни продукти. Индустрията бързо премина от текстови отговори към генерирани от AI снимки и видеоклипове. Сега идва възходът на AI агентите.
Без човек в цикъла
Вместо просто да предоставят отговори – царството на чатботовете и генераторите на изображения – агентите са създадени за производителност и за изпълнение на задачи. Те са AI инструменти, които са в състояние да вземат решения, за добро или лошо, „без човек в цикъла”, казва Кваме, цитиран от CNBC.
Грейс Исфорд, партньор във фирмата за рискови инвестиции Lux Capital, наблюдава „драматично увеличение” на интереса сред технологичните инвеститори, когато става въпрос за стартъпи, фокусирани върху създаване на агенти с изкуствен интелект. Тези млади компании събраха общо стотици милиони долари и видяха как оценките им се покачват заедно с по-широкия пазар на GenAI.
Генеративният изкуствен интелект експлодира през 2023 г. с 29,1 милиарда долара, инвестирани в близо 700 сделки, което е повече от 260% увеличение спрямо година по-рано, според PitchBook. Междувременно пейзажът на инвестициите в проекти без изкуствен интелект е затихнал повече от две години след рекордното финансиране по време на ковид пандемията.
Ако 2023 беше годината на пика на AI хайпа, 2024 г. е годината на ранното внедряване. „Това наистина беше поток от иновации, който се появи на пазара след въвеждането на ChatGPT”, каза Джаред Спатаро, корпоративен вицепрезидент на Microsoft за направлението “AI at Work”. Microsoft е най-големият поддръжник на OpenAI и инвестира милиарди долари в свои собствени генеративни AI модели и продукти, в допълнение към милиардите, които наляла в разработчика на ChatGPT.
Терминът AI агенти не е добре дефиниран в технологичния сектор. Експерти от индустрията като цяло гледат на агентите като на стъпка отвъд чатботовете, тъй като те обикновено са проектирани за специфични бизнес функции и могат да бъдат персонализирани в големите AI модели. Помислете за J.A.R.V.I.S, многостранния AI асистент на Тони Старк от Вселената на Марвел.
AI агентите често се описват като усъвършенствани генеративни AI инструменти, които могат да изпълняват многоетапни, сложни задачи от името на потребителя и да генерират свои собствени списъци със задачи, така че потребителите да не ги водят стъпка по стъпка.
„Асистентът не просто ви дава отговора, а автоматизира поредица от стъпки”, казва Франсоа Аженстат, главен продуктов директор в компанията за дигитален анализ Amplitude.
Играта на Microsoft и Google
Главният изпълнителен директор на Microsoft Сатя Надела заяви по време на разговор за приходите на компанията по-рано тази година, че иска да предложи AI агент, който може да изпълнява все повече и повече задачи от името на потребителя. Шефове от Meta и Google също разкриха, че работят за създаване на по-продуктивни AI асистенти.
На конференцията за разработчици Google I/O през май интернет гигантът обяви Project Astra – проект за AI асистент, който се изгражда от AI поделението DeepMind на Google. В демонстрационен клип асистентът, използвайки видео и аудио, успя да помогне на потребителя да си спомни къде е оставил очилата си, да прегледа код и да отговори на въпроси относно показан обект.
Засега това е само прототип, но изпълнителният директор на Alphabet Сундар Пичай обеща да пусне AI агента за потребителите по-късно тази година. Демото дойде ден след като OpenAI показа подобен аудио разговор с ChatGPT, позиционирайки го по-скоро като AI асистент, който може да функционира като събеседник, езиков преводач, преподавател по математика и съавтор на код.
Последва анонс от Microsoft на конференцията за разработчици Build. Компанията обяви партньорство с Cognition AI, което ще предостави на клиентите собствения AI агент на Cognition, наречен Devin. Cognition смята Devin за „първия софтуерен инженер с изкуствен интелект”.
Devin бързо предизвика вълнение в социалните медии, заради способността си да се справя с многоетапни процеси. Вместо просто да генерира редове код, Devin създава процес за решаване на проблеми, пише кода, тества го и след това го изпраща.
Мартин Кон, оперативен ръководител на AI стартъпа Cohere, заяви, че AI агентите могат да започнат да изпълняват задачи като резервиране на самолетен билет и изчисляване на разхода, предлагане на лихвен процент по заем или изпращане на имейл до клиент за часа на пристигане и актуализиране на Salesforce.
Към днешна дата AI инструментите са ограничен до задачи като помощ при писане на код. В уеб ресурса за разработчици GitHub на Microsoft, например, приблизително 46% от целия код „във всички езици за програмиране” е генериран от AI, съобщи главният изпълнителен директор Томас Домке в блог публикация в началото на 2023 г.
Въпреки че границата между инструмент за кодиране с изкуствен интелект и истински агент с изкуствен интелект е неясна, според повечето експерти, интeрвюирани от CNBC, определящата характеристика на агента е, че той надхвърля рамките на един случай на употреба и започва да се доближава до личен асистент с всички възможности.
Anthropic и други стартиращи компании вече работят за постигане на тази цел. Първата стъпка е да дадат възможност на техните чатботове да взаимодействат с външни инструменти и услуги от името на клиента.
Джаред Спатаро от Microsoft споделя, че процесът на разработване на кодиращия агент Copilot е „като да си привързан към ракетен кораб”. Голяма част от това, което Microsoft прави, е да премине от едно- или двуетапни задачи към многоетапни задачи. Това може да включва разглеждане на календара на потребителя и даване на 30-секундна перспектива за приоритетите през деня.
Фред Хавемайер, мениджър AI и софтуерни изследвания в Macquarie, написа в скорошна бележка до инвеститорите, че фирмата очаква с нетърпение да види повече AI агенти. „Смятаме, че агентният AI, който може да се самонасочва към постигане на задачи, ще бъде инструментът, който отключва стойността на GenAI за ежедневните потребители”, подчерта Хавемайер.
Ромен Хюет, ръководител на отдела за разработчици на OpenAI, коментира, че концепцията за AI агенти е била във фокуса през миналата година, но хората бързо са разбрали, че има още какво да се направи, за да станат AI инструментите по-автономни.
„Разполагаме с модели, които стават все по-мощни, така че сега можем да улавяме намеренията на потребителите много по-добре от преди, но също така все още сме на доста ранен етап в това пътуване при AI агентите”, споделя Хюет. Големият напредък, според него, ще бъде, когато AI агент „може да знае вашите предпочитания и да предприеме действия от ваше име, без да питате”.
Стартъпи за AI агенти привличат големите пари
Стартъпитe за AI агенти се въргалят в огромни купчини пари от инвеститори. Това все пак не е финансирането от над милиарди долари, което влезе в компаниите за AI модели, но оценките все още са далеч пред основите на този нов бизнес.
Adept, който се ръководи от възпитаници на OpenAI и Google, получи оценка от над 1 милиард долара миналата година. Компанията казва на уебсайта си, че нейната технология „навигира в сложността на софтуерните инструменти, така че не е нужно да го правите”.
H, френски стартъп за агент с изкуствен интелект, набра в началния кръг от финансиране през май сумата от $220 милиона, включително от инвеститори като Amazon, Samsung, UiPath и бившия изпълнителен директор на Google Ерик Шмид.
Artisan AI, стартираща компания, подкрепена от Y Combinator и работеща върху AI агенти, които представя като „AI служители за предприятието”, наскоро завърши начален кръг от $7,3 милиона и казва, че досега е включила повече от 100 компании като инвеститори.
Джаспар Кармайкъл-Джак, основателят и главен изпълнителен директор на Artisan AI, подчерта, че през 2022 г. чатботове като ChatGPT за първи път направиха възможно взаимодействието на средния потребител с такива инструменти. „Хората говорят за спада на пазара на рисков капитал като цяло. Но за нас това е като 2021 г. за стартиращите AI компании”, каза Кармайкъл-Джак.
Брейдън Хенкок е работил във Facebook Research и Станфордската лаборатория за изкуствен интелект, преди да стане съосновател на Snorkel AI през 2019 г. Той казва, че пазарът е в „цикъл на реклама, подобен на този на самоуправляващите се автомобили”. По подобен начин, на по-широките AI агенти ще отнеме много време, за да достигнат мейнстрийма.
Ханкок смята, че агентите трябва да станат „многократно” по-добри, преди хората да бъдат готови „да поставят нещо на автопилот”. Според него, когато става въпрос за това технологията да подписва вашето име и да извършва парични преводи от ваше име, „има наистина висока летва”.
Тригодишният стартъп на Канджун Циу, Imbue, е оценен на над 1 милиард долара с подкрепата на Alexa Fund на Amazon и Ерик Шмид. Въз основа на собствено проучване сред потребителите на компанията, Циу казва, че настоящата характеристика на AI агентите – като цяло интелигентни лични асистенти, които се справят с делегирани задачи – не е това, което потребителите всъщност искат, тъй като по дизайн те “не са напълно надеждни”.
„Дори като главен изпълнителен директор ми е трудно да делегирам неща на моя асистент”, признава Циу, който ползва AI агент от две години. „Все още ми е трудно да знам напълно – добре, това ще се върне ли по начина, по който очаквах?”.
Imbue разработва технологии, с които хората могат да създават свои собствени софтуерни агенти с изкуствен интелект – без кодиране. AI агентите работят във фонов режим за техните персонализирани нужди, независимо дали създават начин за проследяване на новините или бот за резервиране на пътуване. Тези типове AI модели няма да имат нужда да се обучават върху потребителски данни, тъй като всеки случай на употреба ще бъде персонализиран.
Вместо да делегира задачи на агент, създаден от подобни агенти на OpenAI или Google, който ще бъде централизиран и контролиран от тези компании, Imbue си представя, че агентите поставят контрола в ръцете на потребителите.
„Има начин да се мисли за агентите като за позволяващи на всеки човек да прави софтуер”, казва Циу. Потребителят „моли агента да напише код на компютъра, за да накара компютъра да прави това, което иска”…
Има една голяма уловка това с chatGPT и подобните му LLM са просто големи езикови модели не е изкуствен интелект в истинския смисъл.