Evaluación de la tarjeta NVIDIA Jetson TK1 para aplicaciones de video-vigilancia
Authors
Ruipérez Gómez, AnaDirector
Losada Gutiérrez, CristinaDate
2019Affiliation
Universidad de AlcaláKeywords
Video-vigilancia
Inteligencia Artificial
GPU
Redes neuronales
NVIDIA Jetson TK1
Document type
info:eu-repo/semantics/masterThesis
Version
info:eu-repo/semantics/acceptedVersion
Rights
Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Access rights
info:eu-repo/semantics/openAccess
Abstract
El presente Trabajo de Fin de Máster tiene como objetivo la evaluación e implementación de un sistema
de video-vigilancia que consiste en un problema de detección de personas en imágenes mediante redes neuronales profundas (Deep learning [1] ). Esta tecnología utiliza un proceso de aprendizaje inspirado en el comportamiento del cerebro humano que permite realizar tareas valiosas en el campo de la videovigilancia como la clasificación de imágenes y el reconocimiento facial. Gracias al buen funcionamiento que ha demostrado en este tipo de tareas, las aplicaciones de seguridad están empezando predecir los problemas antes de que sucedan, lo que supone un gran avance tecnológico.
En este trabajo se ha hecho un estudio teórico de los diferentes tipos de redes neuronales, herramientas de desarrollo y bases de datos disponibles para la clasificación de personas utilizando un sistema de baja potencia como es la tarjeta NVIDIA Jetson TK1 [2]. Para el desarrollo del sistema se ha utilizado la herramienta Caffe y se ha elegido la base de datos PASCAL VOC2012 [3] compuesta por 17.000 imágenes previamente etiquetadas. En el proceso de desarrollo se ha entrenado la red neuronal profunda y se ha llevado a cabo la clasificación de las imágenes haciendo un ajuste experimental de parámetros para conseguir una mejora en los resultados, teniendo en cuenta la precisión y el tiempo ejecución de los mismos.
Finalmente, se han analizado los resultados y se han expuesto las principales conclusiones obtenidas.
Como resultado final, se ha obtenido un 90% de precisión promedio en la detección de personas con
un tiempo medio de 0.508 segundos por imagen, lo que ha permitido validar el funcionamiento del sistema implementado. The purpose of this Master’s Thesis is to evaluate and implement a video surveillance system, which
consists in problem of detection people in images using deep neural networks (Deep leraning). This
technology uses a learning process inspired by the human brain behavior that allows to carry out valuable activities in the video surveillance area such as image classification and facial image recognition. Security applications are beginning to predict the problems before they happen due to the good performance that has demonstrate this type of tasks which is a technological breakthrough.
In this work, a theoretical study has been made of the different types of neural networks, development
tools and databases available for the classification of people using a low power system as the NVIDIA
Jetson TK1 card. For the system development, the Caffe tool and the PASCAL VOC2012 database
composed of 17,000 images previously evaluated were chosen. In the development process, the deep neural network has been trained and the image classification has been made with an experimental adjustment of parameters to get an improvement in the results, taking into account the precision and the execution time.
Finally, the results have been analyzed and the main conclusions have been exposed. As a final result,
a 90% average accuracy was obtained in the detection of people with an average time of 0.5085 seconds per image, which has allowed to validate the good performance of the implemented system.
Files in this item
Files | Size | Format |
|
---|---|---|---|
TFM_Ruiperez_Gomez_2019.pdf | 11.41Mb |
|
Files | Size | Format |
|
---|---|---|---|
TFM_Ruiperez_Gomez_2019.pdf | 11.41Mb |
|