БудинокНовиниНавчання роботів для атлетичних рухів

Навчання роботів для атлетичних рухів



Чи можуть роботи рухатись як спортсмени?Нова модель тренувань допомагає їм повторювати спортивні кроки, але результати показують як прогрес, так і несподівані проблеми.

Команда дослідників AI та робототехніки з університету Карнегі Меллона, а також двох колег з Nvidia, створила нову модель для підготовки роботів, щоб рухатися, як спортсмени людини.Команда зауважила, що більшість робототехнічних тренувань зосереджується на русі, що призводить до роботи, які рухаються ефективно, але без плинності чи атлетизму.Щоб вирішити це, вони досліджували тренування з усього тіла.Вони виявили, що існуючі моделі не вистачає пристосованості і покладалися на занадто багато параметрів, що робить рухи роботів надмірно обережними.Це змусило їх розробити нову двоступеневу тренувальну рамку.

Перший етап тренує модуль AI для аналізу відеоролики з рухом людини з усім тілом, регулюючи ключові рухи, щоб відповідати можливостям робота за допомогою відстеження руху.Другий етап збирає дані в реальному світі, щоб подолати розрив між людським рухом у відео та тим, як роботи можуть фізично рухатися.Цей процес призвів до рамки під назвою Вирівнювання моделювання та реальної фізики (ASAP).

Рамка ASAP складається з чотирьох кроків.По-перше, відстеження руху перед тренуванням та реальною колекцією траєкторії передбачає ретаргетинг гуманоїдних рухів від відео людини.Політика відстеження декількох руху заздалегідь підготовлена ​​для генерування траєкторій руху в реальному світі.Далі навчання моделі Delta Action проводиться за допомогою даних про розробку в реальному світі.Цей крок мінімізує невідповідність між імітованим станом та фактичним реальним станом, підвищенням точності моделі.

На етапі точної настройки політики модель Delta Action замерзла та інтегрується в симулятор, щоб краще узгодитися з фізикою в реальному світі.Потім попередньо підготовлена ​​політика відстеження руху налагоджується для більшої точності.Нарешті, при розгортанні в реальному світі тоно налаштована політика реалізується безпосередньо в реальному світі, не покладаючись на модель Delta Action, гарантуючи, що робот може самостійно виконувати свої навчені рухи.

Щоб перевірити рамки, дослідники підготували робота для повторного використання знакових спортивних рухів.Він здійснив стрибок у стрибку Кобе Брайанта, хід Силенкера Леброна Джеймса та Сіу Кріштіану Роналду з сировим віджиманням середнього повітря.Кожен рух був записаний.

Рухи робота явно нагадують відомі спортивні рухи, підкреслюючи прогрес у русі повного тіла.Однак також очевидно, що потрібно набагато більше роботи, перш ніж робот може помилитися з професійним спортсменом.