Show simple item record

dc.contributor.advisorLópez Sastre, Roberto Javier 
dc.contributor.authorOñoro Rubio, Daniel 
dc.date.accessioned2020-05-11T05:57:38Z
dc.date.available2020-05-11T05:57:38Z
dc.date.issued2019
dc.identifier.urihttp://hdl.handle.net/10017/42627
dc.description.abstractEsta tesis se centra en dos grandes problemas en el área de los sistemas de transportes inteligentes (STI): el conteo de vehículos en escenas de congestión de tráfico; y la detección y estimación del punto de vista, de forma simultánea, de los objetos en una escena. Respecto al problema del conteo, este trabajo se centra primero en el diseño de arquitecturas de redes neuronales profundas que tengan la capacidad de aprender representaciones multi-escala profundas, capaces de estimar de forma precisa la cuenta de objetos, mediante mapas de densidad. Se trata también el problema de la escala de los objetos introducida por la gran perspectiva típicamente presente en el área de recuento de objetos. Además, con el éxito de las redes hourglass profundas en el campo del conteo de objetos, este trabajo propone un nuevo tipo de red hourglass profunda con conexiones de corto circuito auto-gestionadas. Los modelos propuestos se evalúan en las bases de datos públicas más utilizadas y logran los resultados iguales o superiores al estado del arte en el momento en que fueron publicadas. Para la segunda parte, se realiza un estudio comparativo completo del problema de detección de objetos y la estimación de la pose de forma simultánea. Se expone el compromiso existente entre la localización del objeto y la estimación de su pose. Un detector necesita idealmente una representación que sea invariable al punto de vista, mientras que un estimador de poses necesita ser discriminatorio. Por lo tanto, se proponen tres nuevas arquitecturas de redes neurales profundas en las que el problema de la detección de objetos y la estimación de la pose se van desacoplando progresivamente. Además, se aborda la cuestión de si la pose debe expresarse como un valor discreto o continuo. A pesar de ofrecer un rendimiento similar, los resultados muestran que los enfoques continuos son más sensibles al sesgo del punto de vista principal de la categoría del objeto. Se realiza un análisis comparativo detallado en las dos bases de datos principales, es decir, PASCAL3D+ y ObjectNet3D. Se logran resultados competitivos con todos los modelos propuestos en ambos conjuntos de datos.es_ES
dc.format.mimetypeapplication/pdfen
dc.language.isoengen
dc.rightsAttribution-NonCommercial-NoDerivatives 4.0 Internacional*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/4.0/*
dc.subjectInteligencia Artificiales_ES
dc.subjectAnálisis del Tráficoes_ES
dc.subjectSistemas de Tránsito Urbanoes_ES
dc.titleLearning visual representations with deep neural networks for intelligent transportation systems problemses_ES
dc.typeinfo:eu-repo/semantics/doctoralThesisen
dc.subject.ecienciaTelecomunicacioneses_ES
dc.subject.ecienciaTelecommunicationen
dc.contributor.affiliationUniversidad de Alcalá. Departamento de Teoría de la Señal y Comunicacioneses_ES
dc.contributor.affiliationUniversidad de Alcalá. Programa de Doctorado en Tecnologías de la Información y las Comunicacioneses_ES
dc.type.versioninfo:eu-repo/semantics/acceptedVersionen
dc.rights.accessRightsinfo:eu-repo/semantics/openAccessen


Files in this item

Thumbnail

This item appears in the following Collection(s)

Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Este ítem está sujeto a una licencia Creative Commons.