
Новосъздаден стартъп за изкуствен интелект си поставя амбициозната цел да обучи AI моделите така, че да не отговорят по различен начин на един и същи въпрос, зададен от човека.
Мира Мурати, бившият главен технически директор на OpenAI, основа наскоро компанията Thinking Machines Lab, която за кратко време привлече 2 милиарда долара от инвеститори, без да обяви нито един продукт.
Миналата сряда стартъпът най-накрая разкри един от своите проекти: става въпрос за модел на изкуствен интелект, който може да възпроизвежда собствени отговори. Оказва се обаче, че това не е толкова лесно, отбелязва TechCrunch.
Корпоративният блог на Thinking Machines Lab публикува статия, озаглавена „Преодоляване на нестабилността в отговорите на големи езикови модели”. В нея Хорас Хе, изследовател в компанията, се опитва да разкрие коренната причина за случайността в отговорите на моделите с изкуствен интелект.
Ако например, зададете един и същ въпрос на ChatGPT няколко пъти, чатботът винаги ще отговаря по различен начин. Общността на изкуствения интелект е приела тази характеристика за даденост и съвременните модели се считат за недетерминистични системи. Но Thinking Machines Lab вярва, че проблемът е разрешим.
Хорас смята, че основната причина за случайността в работата на AI моделите се крие в механизма на взаимодействие между графичните ядра – и по-точно в алгоритмите, работещи на Nvidia чипове – по време на процеса на извод, т.е. на изхода на AI системата.
Ако осигурим внимателен контрол върху този механизъм, можем да повишим нивото на сигурност в работата на моделите, убеден е Хорас. В резултат на това надеждността на AI отговорите за обикновените потребители, бизнес организациите и учените ще се увеличи.
След като постигнем възпроизводимост, можем също да подобрим качеството на обучението с подсилване – процес, при който AI се възнаграждава за правилни отговори.
Ако всички отговори имат малки разлики, тогава в изходните данни се появява информационен шум. Когато отговорите на AI моделите са по-последователни, тогава процесът на обучение с подсилване става „по-плавен”, разсъждава ученият.
По-рано Thinking Machines Lab заяви пред инвеститорите, че възнамерява да предложи на бизнеса AI модели, настроени с помощта на обучение с подсилване. Мира Мурати обеща да представи първия продукт на компанията през следващите месеци, отбелязвайки, че той ще бъде „полезен за изследователи и стартиращи компании, разработващи свои собствени модели”.
Все още не е ясно какъв е този продукт и дали методите за подобряване на възпроизводимостта на резултатите, посочени в новата статия от компанията, ще бъдат използвани при разработване на AI модела.
Thinking Machines Lab обяви също планове за често публикуване на статии в блогове, които съдържат програмен код и друга информация, за своите изследвания, за да „бъде от полза за обществото, както и да подобри собствената ни култура на научно развитие”.
По време на създаването си, компанията се ангажира с отворена политика по отношение на собствените си изследвания, но с разрастването ѝ тя става все по-затворена.
Последната блог публикация дава рядка възможност да надникнем зад кулисите на един от най-секретните стартъпи в индустрията – точната посока на развитие на технологията все още не е обявена, но има основания да се смята, че Thinking Machines Lab се е заела с решаването на един от най-важните проблеми в областта на изкуствения интелект.
Истинският тест за компанията ще бъде дали може да реши подобни проблеми и да създаде продукти, базирани на тези изследвания, които да оправдаят оценката ѝ от 12 милиарда долара.
