RT info:eu-repo/semantics/bachelorThesis T1 Controlador MPC adaptativo por DQN orientado a la conducción autónoma A1 Oliveros Fernández, Jesús Ángel K1 Controlador K1 Optimización K1 Error K1 Lateral K1 Controller K1 Optimization K1 Yaw K1 Electrónica K1 Ingeniería industrial K1 Electronics K1 Industrial engineering AB El empleo de técnicas de aprendizaje por refuerzo para optimizar sistemas de conducción autónoma estáen constante crecimiento en la actualidad. Los objetivos de este proyecto están basados en mejorar elcomportamiento de un controlador MPC de trayectorias de un vehículo autónomo mediante el uso detécnicas de aprendizaje por refuerzo para estimar el valor óptimo de los pesos de la función de costes delMPC asociados al error de distancia lateral y de yaw.El proyecto se inicia desde una versión del controlador MPC en la que los pesos de error de distancialateral y de yaw (wd y wy respectivamente) tomaban ambos un valor de 10000. Estos valores obtenidosexperimentalmente no presentaban errores altos, aunque aun así se propuso encontrar los valores de pesosóptimos que consiguiesen mejorar el comportamiento del vehículo reduciendo en mayor parte amboserrores a lo largo de la trayectoria.Tras un estudio teórico de las técnicas de aprendizaje por refuerzo, se escogió el algoritmo Actor -Critic por sus similitudes de funcionamiento con las características del problema a resolver. Inicialmente serealizaron una serie de ensayos sobre el entorno de simulación CartPole para entender su funcionamientoy posteriormente implementarlo sobre el sistema del controlador MPC y analizar su comportamiento enel entorno de simulación de vehículos CARLA.El peso asociado al error de distancia lateral fue el primero en ser optimizado buscando así unosvalores de este peso que consiguieran reducir lo máximo posible dicho error. Después, fue modificada laarquitectura del MPC y hubo que adaptar el algoritmo Actor - Critic a esta nueva versión para estimarunos nuevos valores de pesos óptimos de error de distancia lateral.Por último, de forma similar, en la versión final del controlador MPC se procedió a optimizar el errorde yaw del vehículo de nuevo con el algoritmo Actor - Critic obteniendo un rango de valores de peso deerror de yaw que consiguiesen reducir su error respecto a la versión original del MPC.En ambos casos se obtienen unos resultados bastante favorables que consiguen reducir significativamentelos errores originales de distancia lateral y de yaw del MPC respecto a su versión original, ademásde ofrecer una respuesta mucho más suave del sistema, resultado así de una conducción más agradable ysegura para los integrantes del vehículo. YR 2021 FD 2021 LK http://hdl.handle.net/10017/49368 UL http://hdl.handle.net/10017/49368 LA spa DS MINDS@UW RD 19-abr-2024