Por:
Luis Daniel Vega
|
Fecha:
2021
Debido a la limitacin de la comprensin del entorno por parte de los robots mviles en las tareas de planificacin de trayectorias locales, existen problemas de bloqueo local y redundancia de trayectorias durante la planificacin en entornos desconocidos y complejos. En este artculo se propone un nuevo algoritmo basado en la combinacin de una red neuronal con memoria a corto plazo (LSTM), control lgico difuso y aprendizaje por refuerzo, que utiliza las ventajas de cada algoritmo para superar las deficiencias de los dems. En primer lugar, se disea un modelo de red neuronal que incluye unidades LSTM para la planificacin local de trayectorias. En segundo lugar, se utiliza un algoritmo de control lgico difuso (FL) de entrada de baja dimensin para recopilar datos de entrenamiento, y se preentrena un modelo de red (LSTM_FT) transfiriendo el mtodo aprendido para aprender la capacidad bsica. A continuacin, se combina el aprendizaje por refuerzo para aprender nuevas reglas de los entornos de forma autnoma para adaptarse mejor a diferentes escenarios. Por ltimo, el algoritmo de fusin LSTM_FTR se simula en entornos estticos y dinmicos, y se compara con los algoritmos FL y LSTM_FT, respectivamente. Las simulaciones numricas muestran que, en comparacin con FL, LSTM_FTR puede mejorar significativamente la eficiencia en la toma de decisiones, mejorar la tasa de xito en la planificacin de rutas y optimizar la longitud de la ruta. Comparado con LSTM_FT, LSTM_FTR puede mejorar la tasa de xito y aprender nuevas reglas.