Desarrollo de un sistema de detección de personas en ambientes de interior usando cámaras ojo de pez en plano cenital y algoritmos basados en Deep Learning

Menduiña Fernández, Clara (2018). Desarrollo de un sistema de detección de personas en ambientes de interior usando cámaras ojo de pez en plano cenital y algoritmos basados en Deep Learning. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. Telecomunicación (UPM), Madrid.

Description

Title: Desarrollo de un sistema de detección de personas en ambientes de interior usando cámaras ojo de pez en plano cenital y algoritmos basados en Deep Learning
Author/s:
  • Menduiña Fernández, Clara
Contributor/s:
Item Type: Final Project
Degree: Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación
Date: 2018
Subjects:
Freetext Keywords: Detección de personas, cámara ojo de pez, ‘Machine-Learning’, ‘Support Vector Machine’, ‘features’, ‘HOG’, ‘LBP’, sustracción de fondo, ventana deslizante, pirámide gaussiana, ‘Deep-Learning’, redes neuronales, redes neuronales convolucionales, ‘Image Processing’, ‘Computer Vision’, «AlexNet», «VGGNet», ‘bounding-box’, «Python», «Tensorflow», «Keras», «OpenCV», «Faster R-CNN», «SSD».
Faculty: E.T.S.I. Telecomunicación (UPM)
Department: Otro
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[thumbnail of PFC_CLARA_MENDUINA_FERNANDEZ_2018.pdf]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (4MB) | Preview

Abstract

El proyecto consiste en el desarrollo de diversos algoritmos para la detección de personas empleando una cámara ojo de pez. Estos algoritmos van creciendo de manera incremental en complejidad buscando una solución final que permita eficientemente y en el menor tiempo la detección de personas en la imagen captada. El proyecto pretende ofrecer una comparativa de los distintos algoritmos en términos de fiabilidad, tiempo de procesado y problemas detectados. Los primeros algoritmos utilizan técnicas tradicionales de ‘Machine-Learning’ (principalmente un ‘Support Vector Machine’) que será entrenado utilizando diferentes resultados provistos de procesados de imagen como ‘Histogram of Oriented Gradients’ o ‘Local Binary Patterns’ que permiten la extracción de características (‘features’) interesantes de la imagen y técnicas como sustracción de fondo para la detección de movimiento. Los siguientes algoritmos utilizan técnicas de ‘Deep-Learning’, concretamente, redes neuronales tradicionales y redes neuronales convolucionales, estas últimas, muy usadas en disciplinas como ‘Image Processing’ y ‘Computer Vision’. Se implementarán algunas redes neuronales conocidas como por ejemplo «AlexNet» y «VGGNet». Por último, se utilizarán los nuevos paradigmas en detección de objetos basados en redes convolucionales como «SSD» y «Fast-RCNN» que permiten obtener de una sola vez los ‘bounding-box’ correspondientes a las personas que aparezcan en la imagen evitando todo el pre-procesado que requieren los demás algoritmos. El proyecto se basará en el lenguaje de programación «Python» y el uso de una serie de librerías que permiten el uso de ‘frameworks’ como «Tensorflow» y «Keras» para la implementación de redes neuronales de manera rápida. Otra librería muy usada es «OpenCV» que permite el tratamiento de imágenes. El ‘dataset’ utilizado para el entrenamiento y optimización de los algoritmos es de creación propia y tiene en cuenta diferentes personas, con diferente vestimenta y en diferentes posiciones respecto a la cámara debido a la forma que presentan las imágenes captadas por cámaras de este tipo. Además, el dataset incluye las anotaciones reales de los ‘bounding-box’ que recuadran a las personas en la imagen. Una parte muy importante del trabajo es ajustar los parámetros de los algoritmos para un adecuado funcionamiento de los mismos, así como la comprobación de que cada algoritmo presenta sus ventajas e inconvenientes en cuanto a la relación entre tiempo de procesado, porcentaje de acierto y calidad del resultado.

More information

Item ID: 51979
DC Identifier: https://oa.upm.es/51979/
OAI Identifier: oai:oa.upm.es:51979
Deposited by: Biblioteca ETSI Telecomunicación
Deposited on: 04 Sep 2018 07:39
Last Modified: 04 Sep 2018 07:39
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM