Нов тип обучение на роботи позволява използването на “how-to” видео за тренировката на машините (снимка: CC0 Public Domain)
Изследователи от университета Корнел са разработили нова технология за изграждане на роботи, базирана на изкуствен интелект, която позволява на машините да се учат да изпълняват задачи, като гледат видео с инструкции. Технологията е наречена RHyME (Retrieval for Hybrid Imitation under Mismatched Execution).
Роботите могат да бъдат капризни ученици. Обучението им изисква точни инструкции „стъпка по стъпка“ за изпълнение на основни задачи. Освен това те са склонни да „се отказват“, когато нещата се разминат със сценария, например след изпускане на инструмент или загуба на винт. RHyME обаче може да ускори разработването и внедряването на роботизирани системи, като значително намали времето, енергията и парите, необходими за обучението им, казват изследователите.
„Едно от досадните неща при работата с роботи е събирането на огромното количество данни, необходими на робота за изпълняване на различни задачи“, казва Кушал Кедия, докторант в областта на компютърните науки. „Това не е начинът, по който хората изпълняват задачи. Ние гледаме как другите хора правят нещо – и се учим от тях“.
За да обучат роботите как да работят, изследователи като Кедия са се заели да обучават машините по начин, сходен с гледането на видеоклипове с инструкции – демонстрации, направени от човек, на изпълнението на различни задачи в лабораторна обстановка. Надеждата на този подход, клон на машинното обучение, наречен „имитационно обучение“, е роботите да научат поредица от задачи по-бързо и да могат да се адаптират към реални ситуации.
„Нашата работа е като превод между различни езици – ние „превеждаме“ всяка дадена задача от езика на човека на езика на робота“, казва старшият автор Санджибан Чоудхури, доцент по компютърни науки.
Тази задача за „превод“ обаче е изправена пред по-голямо предизвикателство: хората се движат твърде плавно, за да може роботът да ги проследи и имитира, а обучението на роботи с видео изисква много записи. Освен това видеодемонстрациите – например, на вземане на салфетка или подреждане на чинии за вечеря – трябва да се изпълняват бавно и безупречно, тъй като всяко несъответствие в действията между видеото и робота би означавало провал за обучението на робота, казват изследователите.
„Ако човек се движи по начин, различен от начина, по който се движи робот, методът няма да проработи“, казва Чоудхури. „Нашата мисъл беше такава: можем ли да намерим принципен начин да се справим с това несъответствие между начина, по който хората и роботите изпълняват задачи?“
RHyME предполага роботите да изучават многоетапни последователности, като същевременно значително намалява количеството данни, необходими за обучението на роботите, казват изследователите. RHyME изисква само 30 минути данни. В лабораторна обстановка тестовите роботи, обучени с помощта на новата системата, са постигнали над 50% увеличение на успеха в изпълнение на възложените им задачи – в сравнение с предишни методи, казаха изследователите.
„Тази разработка се отклонява от начина, по който роботите се програмират днес. Статуквото на програмирането на роботи е хиляди часове телеоперация, за да се научи роботът как да изпълнява задачи. Това е просто невъзможно“, казва Чоудхури. „С RHyME се отдалечаваме от това и обучаваме роботите по по-мащабируем начин“.