Технологичните гиганти инвестират все повече в разработване на така наречените „суверенни” модели на изкуствен интелект в стремежа си да повишат конкурентоспособността си, като се фокусират върху местната инфраструктура.
Стремежът към суверенитет на данните произтича от идеята, че данните на хората, ползвани от изкуствения интелект, трябва да се съхраняват в инфраструктура в рамките на страната или континента, в който те пребивават.
„Суверенният изкуствен интелект е сравнително нов термин, който се появи през последната година”, казва пред CNBC Крис Гоу, ръководител на европейската публична политика на мрежовия гигант Cisco.
В момента много от най-големите големи езикови модели (LLM), като ChatGPT на OpenAI и Claude на Anthropic, използват центрове за данни, базирани в САЩ, за да съхраняват данни и да обработват заявки чрез облака.
Това доведе до загриженост от страна на политици и регулатори в Европа, които виждат зависимостта от американските технологии като вредна за конкурентоспособността на континента и, което е по-притеснително, за технологичната устойчивост.
Откъде идва „AI суверенитетът”
Връзката между данните и технологичния суверенитет е нещо, което и преди е било в дневния ред на Европа, отчасти като резултат от реакцията на бизнеса на новите разпоредби.
Общият регламент за защита на данните на Европейския съюз (GDPR), например, изисква компаниите да обработват потребителските данни по сигурен, съвместим начин, който зачита правото на поверителност. Известни случаи в ЕС също повдигнаха съмнения относно това дали данните на европейските граждани могат да се прехвърлят безопасно през границите.
През 2020 г. Европейският съд анулира споразумение между ЕС и САЩ за споделяне на данни на основание, че пактът не предоставя същото ниво на защита, което се гарантира в рамките на ЕС от GDPR. Миналата година беше създадена рамка за поверителност на данните между ЕС и САЩ, за да се гарантира, че данните могат да протичат безопасно между двата региона.
Това политическо развитие в крайна сметка доведе до тласък на локализирането на облачната инфраструктура, в която се съхраняват и обработват данните за много онлайн услуги.
Филипо Санеси, глобален ръководител на маркетинга и операциите във френската компания OVHCloud, казва, че има голямо търсене на нейната инфраструктура, разположена в Европа, тъй като клиентите „разбират стойността на това да държат в Европа своите данни, които са предмет на европейското законодателство”.
„Тъй като концепцията за суверенитет на данните става все по-зряла и хората разбират какво означава това, виждаме все повече и повече компании да осъзнават важността на разполагането на вашите данни на местно ниво и под специфична юрисдикция и управление”, коментира Санеси пред CNBC.
„Имаме много данни, те са суверенни в конкретни държави, съгласно специфични разпоредби. Сега, с тези данни, вие всъщност можете да създавате продукти и услуги за AI и тези услуги също трябва да бъдат суверенни, трябва да се контролират, внедряват и развиват на местно ниво от местни таланти за местното население или бизнеса”, допълва той.
Стремежът към суверенитет на изкуствения интелект не е тласкан напред от регулаторите – поне не все още, според Гоу от Cisco. По-скоро идва от частни компании, които отварят повече центрове за данни – съоръжения, съдържащи огромни количества изчислително оборудване за активиране на базирани в облака AI инструменти – в Европа, казва той.
Суверенният изкуствен интелект е „движен повече от индустрията, която го наименува така, отколкото от политиците”, смята Гоу. „Все още не виждате терминологията „AI суверенитет” да се използва от страна на регулатора”.
Държавите настояват за суверенитет на изкуствения интелект, защото признават, че AI е „бъдещето” и „масивна стратегическа технология”, казва Гоу.
Правителствата се съсредоточават върху насърчаване на своите местни технологични компании и екосистеми, както и върху изключително важната бекенд инфраструктура, която позволява предлагане на AI услуги.
„Работното натоварване с изкуствен интелект използва 20 пъти по-голяма честотна лента от традиционното работно натоварване”, казва Гоу. Според него, става въпрос и за осигуряване на работната сила, тъй като фирмите се нуждаят от квалифицирани служители, за да бъдат успешни.
Най-важни от всичко обаче са данните. „Това, което виждате, са доста опити да се мисли за обучение на LLM върху локализирани данни”, подчертава Гоу.
„Отразяване на ценностите”
В Италия първият LLM, обучен специално върху данни на италиански език и наречен Italia 9B, стартира това лято. Целта на проекта е да съхранява резултатите в дадена юрисдикция и да разчита на данни от граждани в този регион, така че резултатите, произведени от AI системите там, да са основани на местните езици, култура и история.
„Суверенният AI отразява ценностите на една организация или, по същия начин, ценностите и езика на страната, в която се намирате”, казва Дейвид Хоган, ръководител на корпоративните продажби за EMEA на гиганта в производството на AI чипове Nvidia.
„Основното предизвикателство е, че повечето AI модели днес са обучени предимно на западни данни като цяло”, добавя Хоган.
В Дания например, където Nvidia има голямо присъствие, служителите са загрижени за жизненоважни услуги като здравеопазване и телекомуникации, доставяни от AI системи, които не „отразяват” местната датска култура и ценности, според Хоган.
В сряда Дания изложи забележителна бяла книга, която очертава как компаниите могат да използват AI в съответствие със Закона за изкуствения интелект на ЕС – първият в света всеобхватен закон за AI. Документът има за цел да послужи като план за следване и възприемане от други държави от ЕС.
„Ако сте в европейска страна, която не е една от основните езикови държави в международен план, вероятно по-малко от 2% от данните са обучени на вашия език – да не говорим за вашата култура”, казва Хоган.
Как регулацията подхранва промяна в мисленето
Всичко казано дотук не означава, че регулациите не са важен фактор, който да накара технологичните гиганти да мислят повече за изграждане на локализирана AI инфраструктура в Европа. Санеси от OVHCloud казва, че регулации като GDPR на ЕС са катализирали голяма част от интереса към локалната обработка на данни в даден регион.
Концепцията за суверенитет на изкуствения интелект също се подкрепя от местни европейски технологични фирми. По-рано тази седмица търсачката Ecosia със седалище в Берлин и базираната в Париж Qwant обявиха съвместно предприятие за разработване на европейски индекс за търсене от нулата, целящ да достави подобрени резултати на френски и немски език.
Междувременно френският телеком оператор Orange заяви, че води дискусии с редица основополагащи компании за AI модели относно изграждането на базиран на смартфон модел на „суверенен AI” за своите клиенти, който отразява по-точно техния собствен език и култура.
„Няма смисъл да създаваме наши собствени LLMs. В момента има много дискусии за това как да си партнираме със съществуващите доставчици, за да направим AI по-локален и по-безопасен”, казва Бруно Зербиб, главен технологичен директор на Orange.
„Има много случаи на употреба, при които [данните за AI] могат да се обработват локално [на телефон], вместо в облака”, добавя той. Orange все още не е избрала партньор за реализиране на своите амбиции за суверенен AI модел.