Robô de duas pernas aprende a andar usando aprendizado por reforço

O trabalho envolveu a criação de um robô de duas pernas. Seu par de membros está unido por um pequeno

segurando o quadro.Agora o robô, que os autores chamaram de “Cassie”, realiza suas tarefas amarrado a uma estrutura controlada por um dos pesquisadores. Comparado a outros robôs, como os desenvolvidos pela Boston Dynamics, Cassie parece primitivo. No entanto, representa um novo tipo de tecnologia avançada em que o robô aprende a andar sem programação direta ou imitação.

Como as pessoas aprendem a andar?Usando o Aprendizado por Reforço! Os bebês aprendem essa habilidade tentando novos movimentos. Eles não entendem todo o processo de uma vez, mas se lembram dos passos que levam ao caminhar. E, então, aumente o que você aprendeu, acrescentando informações adicionais que, em última análise, conduzam a uma caminhada adequada. Ao mesmo tempo, as crianças não param por aí; eles continuam aprendendo e seu andar fica melhor. Com o tempo, as crianças aprendem novas técnicas como correr e pular.

Para ajudar o robô a aprender a andar assimAssim, os pesquisadores começaram simulando-o no mundo virtual. Lá, o robô é treinado usando informações, e a IA pode memorizá-las e usá-las. A simulação permitiu ao robô aprender a andar sem danificar o equipamento.

Uma vez que o robô aprendeu a andar na simulação,os pesquisadores repassaram seus conhecimentos para Cassie, que os usava para andar como bebês. E como uma criança, "Cassie", ela melhorou suas habilidades. Ela aprendeu a não cair com um leve escorregão ou a se recuperar quando é empurrada de lado. Além disso, ela foi ensinada a compensar os danos quando os dois motores são danificados. Os pesquisadores planejam continuar seu trabalho com o aprendizado de reforço robótico para ver até onde eles podem ir.

Consulte Mais informação

O primeiro mapa preciso do mundo foi criado. O que há de errado com todo mundo?

Urano recebeu o status de planeta mais estranho do sistema solar. Porque?

A NASA disse como vai entregar amostras de Marte à Terra