Посмотрите, как робот играет в настольный теннис всего через 90 минут тренировки.
Робот, играющий в настольный теннис, может не отставать от людей, но, как и многие игроки-любители, он изо всех сил пытается сделать более удачные удары.
Япенг Гао, Йонас Теббе и Андреас Целль из Тюбингенского университета в Германии начали с разработки компьютерной симуляции, в которой виртуальная рука робота, оснащенная ракеткой для настольного тенниса, пыталась отбросить мячи для пинг-понга через виртуальный стол для настольного тенниса.
Исследователи выполнили это моделирование, чтобы алгоритм машинного обучения мог узнать, как скорость и ориентация ракетки влияют на траекторию мяча.
Как только этот алгоритм, который обучается методом проб и ошибок, смог надежно возвращать мяч, исследователи настроили его для управления движением реальной руки робота, расположенной рядом с реальным столом (на фото).
Система использовала две камеры для отслеживания местоположения реального мяча каждые 7 миллисекунд, а алгоритм обрабатывал сигналы и решал, куда переместить роботизированную руку, чтобы ударить и вернуть мяч.
Сигналы, которые отправлял алгоритм, позволяли руке робота точно воспроизводить удары с точностью до 24,9 сантиметра от предполагаемого места. Этот уровень точности был немного хуже, чем когда алгоритм работал с симуляцией - обычное явление, говорит Йонас Теббе, поскольку компьютерное моделирование не может точно представить все в реальной жизни.
Рука робота сталкивается с человеком-игроком. Фото: Yapeng Gao, Jonas Tebbe, and Andreas Zell
Весь процесс, включая обучение в виртуальном моделировании и в реальном мире, занял всего 1,5 часа, демонстрируя, как быстро алгоритмы могут научиться работать в новой ситуации.
Однако, хотя робот хорошо показал себя против игроков-людей, отбивая быстрые удары - но, что удивительно, это не касалось медленных ударов. «Если мяч движется медленно, роботу необходимо развивать большую скорость для ответного удара», - говорит Теббе. При попытке сделать это, мяч часто падал с ракетки.
«При обучении системы в течение относительно короткого периода времени, робот может хорошо справляться с различиями в подаче и может возвращать удар, используя случайную политику», - говорит Джонатан Эйткен из Университета Шеффилда в Великобритании, который не принимал участия в исследовании.
Эйткен был удивлен, что алгоритм провалился на задаче по возвращению медленных ударов. Он также находит интересным то, что иногда ему было трудно делать удары из-за механических ограничений робототехнической системы, а не из-за недостатков алгоритма.
У робота-манипулятора есть и другие ограничения. Например, он с трудом воспроизводит удары с обратным вращением, говорит Андреас Целль, потому что рука робота не может удерживать ракетку под требуемым углом, необходимым для выполнения таких ударов. Но, несмотря на эти проблемы, он считает, что робот - хороший игрок.
«Это не хуже, чем у обычного человека-игрока», - говорит он. «Он уже на одном уровне со мной».
Статья была опубликована в arXiv.
Источник: New Scientist