강화 학습을 사용하여 걷는 법을 배운 두 다리 로봇

이 작업에는 다리가 두 개 달린 로봇을 만드는 작업이 포함되었습니다. 그의 한 쌍의 팔다리는 작은 뼈로 서로 연결되어 있습니다.

프레임을 들고 있습니다.이제 저자가 "Cassie"라고 명명한 로봇은 연구원 중 한 명이 제어하는 ​​프레임에 연결된 작업을 수행합니다. Boston Dynamics가 개발한 로봇과 같은 다른 로봇에 비해 Cassie는 원시적인 것처럼 보입니다. 그러나 직접적인 프로그래밍이나 모방 없이 로봇이 스스로 걷는 법을 배우는 새로운 유형의 첨단 기술을 의미합니다.

사람들은 걷는 법을 어떻게 배웁니까?강화 학습 사용! 아기는 새로운 동작을 시도하여이 기술을 배웁니다. 그들은 전체 과정을 한꺼번에 이해하지 못하지만 걷기로 이어지는 단계를 기억합니다. 그런 다음 배운 것을 바탕으로 궁극적으로 적절한 걷기로 이어지는 추가 정보를 추가하십시오. 동시에 아이들은 거기서 멈추지 않습니다. 계속 배우고 걸음 걸이가 좋아집니다. 시간이 지남에 따라 아이들은 달리기와 점프와 같은 새로운 기술을 배웁니다.

로봇이 이렇게 걷는 법을 배우도록 돕기 위해따라서 연구자들은 가상 세계에서 시뮬레이션을 시작했습니다. 그곳에서 로봇은 정보를 사용하여 훈련을 받고 AI는 그것을 기억하고 사용할 수 있습니다. 시뮬레이션을 통해 로봇은 장비를 손상시키지 않고 걷는 법을 배울 수있었습니다.

로봇이 시뮬레이션에서 걷는 법을 배우면연구원들은 그의 지식을 아기처럼 걷는 데 사용했던 캐시에게 전수했습니다. 그리고 어렸을 때 "Cassie"는 기술을 향상 시켰습니다. 그녀는 약간의 미끄러짐에 넘어지지 않거나 옆에서 밀렸을 때 회복하는 법을 배웠습니다. 또한 두 엔진이 모두 손상되었을 때 손상을 보상하는 방법을 가르 칠 수있었습니다. 연구진은 로봇 강화 학습으로 작업을 계속하여 그들이 얼마나 멀리 갈 수 있는지 확인할 계획입니다.

더 읽어보기

세계 최초의 정확한지도가 만들어졌습니다. 다른 사람들에게 무슨 문제가 있습니까?

천왕성은 태양계에서 가장 이상한 행성의 지위를 받았습니다. 왜?

NASA는 화성 샘플을 지구로 전달하는 방법을 말했습니다.