Show simple item record

dc.contributor.advisorSánchez Prieto, Sebastián 
dc.contributor.advisorMartínez Marín, Tomás 
dc.contributor.authorGómez Plaza, Mariano 
dc.date.accessioned2011-03-01T08:58:29Z
dc.date.available2011-03-01T08:58:29Z
dc.date.issued2009
dc.identifier.urihttp://hdl.handle.net/10017/8032
dc.description.abstractEl presente trabajo de investigación se ha centrado en la propuesta de un algoritmo, capaz de realizar una planificación óptima de movimiento en vehículos móviles autónomos, pasándose en técnicas de control óptimo en lazo cerrado. Estos vehículos se caracterizan por estar dotados de cuatro ruedas, con dirección delantera y tracción delantera o trasera y, fundamentalmente, por ser sistemas dinámicos no lineales en los cuales la planificación de movimiento y su control, son tareas complejas, debido a que se trata de sistemas no-holonómicos. Todos los estudios llevados a cabo para la puesta en práctica de esta planificación óptima se han realizado considerando como base teórica los conceptos de aprendizaje por refuerzo y espacio de estados celular. El nuevo algoritmo propuesto tiene la peculiaridad de ser muy robusto ante posibles cambios en el entorno o en la estructura física o mecánica del propio vehículo, de manera que la generación del controlador óptimo vendrá dada, una vez que se haya ejecutado previamente una fase de aprendizaje por la que estos cambios se habrán tenido en cuenta de forma implícita por el algoritmo. El aprendizaje está orientado a alcanzar un objetivo de acuerdo a un criterio de optimización (p.e. tiempo mínimo). El vehículo aprende de su propia experiencia, la dinámica y cinemática sin necesidad de disponer de modelos matemáticos. Además, otro aspecto del algoritmo que reduce drásticamente el tiempo de aprendizaje es su capacidad para extrapolar el conocimiento adquirido localmente en una zona del espacio, al resto del espacio sin necesidad de que el vehículo se mueva físicamente a todos los puntos de dicho espacio. Una vez que el aprendizaje concluye, la generación de trayectorias desde diversos orígenes para alcanzar el objetivo deseado se hace en lazo cerrado aplicando en cada momento las acciones de control óptimas dependiendo de las condiciones de estado del vehículo en dicho momento.en_US
dc.format.mimetypeapplication/pdfen
dc.language.isospaen_US
dc.subjectRobots móviles - Controlen_US
dc.subjectOrdenadores - Diseño y construcciónen_US
dc.titlePlanificación óptima de movimiento y aprendizaje por refuerzo en vehículos móviles autónomosen_US
dc.typeinfo:eu-repo/semantics/doctoralThesisen
dc.subject.ecienciaCiencias tecnológicas
dc.subject.ecienciaAutomatización
dc.subject.ecienciaAutomation
dc.contributor.affiliationUniversidad de Alcalá. Departamento de Automática
dc.type.versioninfo:eu-repo/semantics/acceptedVersionen
dc.rights.accessRightsinfo:eu-repo/semantics/openAccessen


Files in this item

Thumbnail

This item appears in the following Collection(s)