Implementación de un sistema de visión artificial para detección de coches en tiempo real mediante Caffe2 y C++

Ros Martínez, Héctor (2018). Implementación de un sistema de visión artificial para detección de coches en tiempo real mediante Caffe2 y C++. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. Telecomunicación (UPM), Madrid.

Description

Title: Implementación de un sistema de visión artificial para detección de coches en tiempo real mediante Caffe2 y C++
Author/s:
  • Ros Martínez, Héctor
Contributor/s:
Item Type: Final Project
Degree: Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación
Date: 2018
Subjects:
Freetext Keywords: Visión artificial, Deep Learning, redes neuronales, detección de objetos, tiempo real, Caffe2, OpenCV, C++
Faculty: E.T.S.I. Telecomunicación (UPM)
Department: Señales, Sistemas y Radiocomunicaciones
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[thumbnail of PFC_HECTOR_ROS_MARTINEZ_2018.pdf]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (10MB) | Preview

Abstract

La visión artificial se entiende como un conjunto de métodos que permiten adquirir,
procesar y analizar imágenes procedentes del mundo real con el fin de extraer información que
pueda ser utilizada por una máquina; en este trabajo se van a utilizar redes neuronales y técnicas
de Deep Learning para tal fin. Ambos conceptos van estrechamente ligados, por un lado, las
redes neuronales son un paradigma de programación inspirado en el funcionamiento del cerebro
humano y el Deep Learning es un enfoque de la inteligencia artificial, concretamente, un tipo de
aprendizaje automático que permite que los sistemas informáticos mejoren con la experiencia y
los datos; lo que proporciona un conjunto de técnicas que permite aprender a una red neuronal a
partir de información, en este caso extraída de imágenes.
El objetivo principal del trabajo consiste en el desarrollo de un programa que permita la
detección de coches, a partir de una imagen, de forma automática. Para ello, se ha desplegado
una red neuronal y entrenado utilizando técnicas de Deep Learning. Esto permite analizar y
extraer información de imágenes reales de coches que han sido previamente capturadas, con el
objetivo de conseguir el aprendizaje del sistema. Todo esto se consigue a través de Caffe2, un
framework diseñado para la implementación y entrenamiento de redes neuronales. Otro detalle a
tener en cuenta es que se va a implementar un sistema que trabaje en tiempo real y que pueda
ser trasladado a una plataforma embebida, por lo que se ha planteado como requisito el uso de
un lenguaje de programación de bajo nivel como es C++.
La metodología empleada consta de las siguientes etapas. La primera es el estudio y
lectura de la teoría necesaria para la compresión de la visión artificial, que incluye tanto el
tratamiento digital de imágenes como la tecnología de redes neuronales y Deep Learning. Una
vez completada esa fase es necesaria la familiarización con el entorno de trabajo utilizado. Este
se compone principalmente de tres pilares: en primer lugar, Qt Creator, un entorno de trabajo
que permite desarrollar programas en C++ con una estructura de ventanas; en segundo lugar, es
necesaria una librería para manejo de imágenes y vídeo, por lo que se usará OpenCV, una
colección de herramientas para el tratamiento digital de imágenes; por último, se utilizará
Caffe2 como framework para la implementación de redes neuronales convolucionales. Estos
frameworks permiten abstraerse de las capas bajas de implementación y utilizar las redes de
forma más sencilla. La siguiente fase del trabajo es el despliegue de una red neuronal con el
objetivo de realizar pruebas tales como: variación de parámetros intrínsecos de la misma,
número de capas intermedias, número de entradas, cambio del tamaño de la base de datos de
imágenes utilizadas para el aprendizaje o alteración del tamaño de las imágenes empleadas.
Como fase final se encuentra la extracción de conclusiones en base a los ensayos realizados.

More information

Item ID: 53024
DC Identifier: https://oa.upm.es/53024/
OAI Identifier: oai:oa.upm.es:53024
Deposited by: Biblioteca ETSI Telecomunicación
Deposited on: 15 Nov 2018 11:10
Last Modified: 15 Nov 2018 11:10
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM