Full text
Preview |
PDF
- Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (10MB) | Preview |
Ros Martínez, Héctor (2018). Implementación de un sistema de visión artificial para detección de coches en tiempo real mediante Caffe2 y C++. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. Telecomunicación (UPM), Madrid.
Title: | Implementación de un sistema de visión artificial para detección de coches en tiempo real mediante Caffe2 y C++ |
---|---|
Author/s: |
|
Contributor/s: |
|
Item Type: | Final Project |
Degree: | Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación |
Date: | 2018 |
Subjects: | |
Freetext Keywords: | Visión artificial, Deep Learning, redes neuronales, detección de objetos, tiempo real, Caffe2, OpenCV, C++ |
Faculty: | E.T.S.I. Telecomunicación (UPM) |
Department: | Señales, Sistemas y Radiocomunicaciones |
Creative Commons Licenses: | Recognition - No derivative works - Non commercial |
Preview |
PDF
- Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (10MB) | Preview |
La visión artificial se entiende como un conjunto de métodos que permiten adquirir,
procesar y analizar imágenes procedentes del mundo real con el fin de extraer información que
pueda ser utilizada por una máquina; en este trabajo se van a utilizar redes neuronales y técnicas
de Deep Learning para tal fin. Ambos conceptos van estrechamente ligados, por un lado, las
redes neuronales son un paradigma de programación inspirado en el funcionamiento del cerebro
humano y el Deep Learning es un enfoque de la inteligencia artificial, concretamente, un tipo de
aprendizaje automático que permite que los sistemas informáticos mejoren con la experiencia y
los datos; lo que proporciona un conjunto de técnicas que permite aprender a una red neuronal a
partir de información, en este caso extraída de imágenes.
El objetivo principal del trabajo consiste en el desarrollo de un programa que permita la
detección de coches, a partir de una imagen, de forma automática. Para ello, se ha desplegado
una red neuronal y entrenado utilizando técnicas de Deep Learning. Esto permite analizar y
extraer información de imágenes reales de coches que han sido previamente capturadas, con el
objetivo de conseguir el aprendizaje del sistema. Todo esto se consigue a través de Caffe2, un
framework diseñado para la implementación y entrenamiento de redes neuronales. Otro detalle a
tener en cuenta es que se va a implementar un sistema que trabaje en tiempo real y que pueda
ser trasladado a una plataforma embebida, por lo que se ha planteado como requisito el uso de
un lenguaje de programación de bajo nivel como es C++.
La metodología empleada consta de las siguientes etapas. La primera es el estudio y
lectura de la teoría necesaria para la compresión de la visión artificial, que incluye tanto el
tratamiento digital de imágenes como la tecnología de redes neuronales y Deep Learning. Una
vez completada esa fase es necesaria la familiarización con el entorno de trabajo utilizado. Este
se compone principalmente de tres pilares: en primer lugar, Qt Creator, un entorno de trabajo
que permite desarrollar programas en C++ con una estructura de ventanas; en segundo lugar, es
necesaria una librería para manejo de imágenes y vídeo, por lo que se usará OpenCV, una
colección de herramientas para el tratamiento digital de imágenes; por último, se utilizará
Caffe2 como framework para la implementación de redes neuronales convolucionales. Estos
frameworks permiten abstraerse de las capas bajas de implementación y utilizar las redes de
forma más sencilla. La siguiente fase del trabajo es el despliegue de una red neuronal con el
objetivo de realizar pruebas tales como: variación de parámetros intrínsecos de la misma,
número de capas intermedias, número de entradas, cambio del tamaño de la base de datos de
imágenes utilizadas para el aprendizaje o alteración del tamaño de las imágenes empleadas.
Como fase final se encuentra la extracción de conclusiones en base a los ensayos realizados.
Item ID: | 53024 |
---|---|
DC Identifier: | https://oa.upm.es/53024/ |
OAI Identifier: | oai:oa.upm.es:53024 |
Deposited by: | Biblioteca ETSI Telecomunicación |
Deposited on: | 15 Nov 2018 11:10 |
Last Modified: | 15 Nov 2018 11:10 |