Logo PUCPR

DEVELOPMENT OF A MECHATRONIC BENCHMARK TEST BED FOR ANOMALY DETECTION AND CONTROL

MOURA, Allan Henrique Vanto de ¹; MEZA, Gilberto Reynoso ³; MEZA, Gilberto Reynoso ²; SANTOS, Maria Angela Moscalewski Roveredo dos ²
Curso do(a) Estudante: Engenharia de Computação – Escola Politécnica – Câmpus Curitiba
Curso do(a) Orientador(a): Engenharia Controle e Automação – Escola Politécnica – Câmpus Curitiba

Introdução: A locomoção de robôs quadrúpedes em ambientes complexos representa um dos maiores desafios da robótica móvel, especialmente quando ocorrem falhas em um ou mais membros. Este trabalho propõe uma abordagem baseada em aprendizado por reforço profundo para permitir que um robô quadrúpede continue se locomovendo mesmo na ausência funcional de uma de suas patas. Objetivos: O objetivo principal foi desenvolver políticas de controle robustas e adaptativas utilizando o algoritmo Proximal Policy Optimization (PPO), com foco em cenários simulados de falha locomotora. Para isso, foi utilizado o motor de física PyBullet aliado ao ambiente OpenCat-Gym, com o modelo do robô Bittle. Materiais e método: A metodologia envolveu a criação de um ambiente personalizado no qual as juntas de uma das patas foram desativadas, forçando o robô a encontrar novas estratégias de locomoção. O processo de treinamento foi realizado em episódios com múltiplas penalidades e recompensas voltadas à movimentação eficiente, estabilidade e suavidade dos movimentos. Resultados: Os testes demonstraram que o robô foi capaz de desenvolver comportamentos adaptativos eficazes, mantendo a estabilidade mesmo com a ausência funcional de uma pata. Embora tenha ocorrido uma redução de desempenho em comparação ao modelo com as quatro patas ativas, o agente treinado manteve sua capacidade locomotora funcional. A aplicação do algoritmo PPO em ambientes simulados mostrou-se eficaz no desenvolvimento de estratégias adaptativas, reforçando a utilidade da simulação para antecipação de falhas e validação de políticas de controle. Considerações finais: Essa abordagem contribui para a confiabilidade de sistemas robóticos em contextos críticos, como missões de busca e resgate, exploração e robótica assistiva.

Palavras-chave: Robótica; Aprendizado por Reforço; PPO; Simulação; Robôs Quadrúpedes.

APRESENTAÇÃO EM VÍDEO

Esta pesquisa foi desenvolvida com bolsa PUCPR no programa PIBITI Jr.
Legendas:
  1. Estudante
  2. Orientador
  3. Colaborador

QUERO VOTAR NESTE TRABALHO

Para validarmos seu voto, por favor, preencha os campos abaixo. Alertamos que votos duplicados ou com CPF inválido não serão considerados.