Implementación de un sistema de visión artificial para detección de coches en tiempo real mediante Caffe2 y C++

Ros Martínez, Héctor (2018). Implementación de un sistema de visión artificial para detección de coches en tiempo real mediante Caffe2 y C++. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. Telecomunicación (UPM), Madrid.

Description

Title: Implementación de un sistema de visión artificial para detección de coches en tiempo real mediante Caffe2 y C++
Author/s:
  • Ros Martínez, Héctor
Contributor/s:
  • Rodrigo Ferrán, Juan Antonio
Item Type: Final Project
Degree: Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación
Date: 2018
Subjects:
Freetext Keywords: Visión artificial, Deep Learning, redes neuronales, detección de objetos, tiempo real, Caffe2, OpenCV, C++
Faculty: E.T.S.I. Telecomunicación (UPM)
Department: Señales, Sistemas y Radiocomunicaciones
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (10MB) | Preview

Abstract

La visión artificial se entiende como un conjunto de métodos que permiten adquirir, procesar y analizar imágenes procedentes del mundo real con el fin de extraer información que pueda ser utilizada por una máquina; en este trabajo se van a utilizar redes neuronales y técnicas de Deep Learning para tal fin. Ambos conceptos van estrechamente ligados, por un lado, las redes neuronales son un paradigma de programación inspirado en el funcionamiento del cerebro humano y el Deep Learning es un enfoque de la inteligencia artificial, concretamente, un tipo de aprendizaje automático que permite que los sistemas informáticos mejoren con la experiencia y los datos; lo que proporciona un conjunto de técnicas que permite aprender a una red neuronal a partir de información, en este caso extraída de imágenes. El objetivo principal del trabajo consiste en el desarrollo de un programa que permita la detección de coches, a partir de una imagen, de forma automática. Para ello, se ha desplegado una red neuronal y entrenado utilizando técnicas de Deep Learning. Esto permite analizar y extraer información de imágenes reales de coches que han sido previamente capturadas, con el objetivo de conseguir el aprendizaje del sistema. Todo esto se consigue a través de Caffe2, un framework diseñado para la implementación y entrenamiento de redes neuronales. Otro detalle a tener en cuenta es que se va a implementar un sistema que trabaje en tiempo real y que pueda ser trasladado a una plataforma embebida, por lo que se ha planteado como requisito el uso de un lenguaje de programación de bajo nivel como es C++. La metodología empleada consta de las siguientes etapas. La primera es el estudio y lectura de la teoría necesaria para la compresión de la visión artificial, que incluye tanto el tratamiento digital de imágenes como la tecnología de redes neuronales y Deep Learning. Una vez completada esa fase es necesaria la familiarización con el entorno de trabajo utilizado. Este se compone principalmente de tres pilares: en primer lugar, Qt Creator, un entorno de trabajo que permite desarrollar programas en C++ con una estructura de ventanas; en segundo lugar, es necesaria una librería para manejo de imágenes y vídeo, por lo que se usará OpenCV, una colección de herramientas para el tratamiento digital de imágenes; por último, se utilizará Caffe2 como framework para la implementación de redes neuronales convolucionales. Estos frameworks permiten abstraerse de las capas bajas de implementación y utilizar las redes de forma más sencilla. La siguiente fase del trabajo es el despliegue de una red neuronal con el objetivo de realizar pruebas tales como: variación de parámetros intrínsecos de la misma, número de capas intermedias, número de entradas, cambio del tamaño de la base de datos de imágenes utilizadas para el aprendizaje o alteración del tamaño de las imágenes empleadas. Como fase final se encuentra la extracción de conclusiones en base a los ensayos realizados.

More information

Item ID: 53024
DC Identifier: http://oa.upm.es/53024/
OAI Identifier: oai:oa.upm.es:53024
Deposited by: Biblioteca ETSI Telecomunicación
Deposited on: 15 Nov 2018 11:10
Last Modified: 15 Nov 2018 11:10
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM