Desarrollo de algoritmos de estimación de mapas profundidad a partir de imágenes RGB mediante técnicas de aprendizaje profundo

Vargas del Campo, Alan (2020). Desarrollo de algoritmos de estimación de mapas profundidad a partir de imágenes RGB mediante técnicas de aprendizaje profundo. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. Telecomunicación (UPM).

Description

Title: Desarrollo de algoritmos de estimación de mapas profundidad a partir de imágenes RGB mediante técnicas de aprendizaje profundo
Author/s:
  • Vargas del Campo, Alan
Contributor/s:
  • Belmonte Hernández, Alberto
Item Type: Final Project
Degree: Grado en Ingeniería de Tecnologías y Servicios de Telecomunicación
Date: 2020
Subjects:
Freetext Keywords: `Machine-Learning', 'Deep-Learning', 'Auto-encoder', GAN, Pix2Pix, Redes Neuronales, Redes Neuronales Convolucionales, Métricas de Similitud, MSE, SSIM, PSNR, NYU, Profundidad, 'Información Mutua', 'Perceptual Similarity', 'Procesamiento de Imágenes', `Computer Vision', Python, Tensorflow, Keras, Pytorch, OpenCV
Faculty: E.T.S.I. Telecomunicación (UPM)
Department: Señales, Sistemas y Radiocomunicaciones
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (7MB) | Preview

Abstract

La utilización de redes neuronales para el procesamiento de imágenes ha crecido de manera exponencial en los últimos años. Concretamente, la estimación de mapas de profundidad ha sido una problemática para la cual se han presentado diversas soluciones tanto software como hardware. En este proyecto se presentará el desarrollo, entrenamiento, análisis y comparación en términos de precisión de tres redes neuronales. Las dos primeras propuestas con arquitectura tipo Autoencoder y una tercera con arquitectura GAN, Para la comparación de las redes, se escogerán los parámetros de entrenamiento buscando optimizar el aprendizaje y se analizarán los resultados obtenidos mediante distintas métricas de validación. Finalmente se validará la solución sobre dos aplicaciones reales para justificar el uso de los resultados en ambientes reales. El proyecto será desarrollado en el lenguaje de programación Python. El dataset (con parte de creación propia) ha sido recolectado mediante la utilización de una cámara RGB-D la cual proporciona la imagen RGB y su mapa de profundidad correspondiente. Las imágenes obtenidas han sido mezcladas con un dataset específico para la estimación de profundidad con el objetivo de entrenar de forma óptima las redes propuestas. Se han utilizado librerías tales como OpenCV y Keras para facilitar el procesamiento de las imágenes y la creación y entrenamiento de las redes neuronales.

More information

Item ID: 63002
DC Identifier: http://oa.upm.es/63002/
OAI Identifier: oai:oa.upm.es:63002
Deposited by: Biblioteca ETSI Telecomunicación
Deposited on: 15 Jul 2020 07:06
Last Modified: 15 Jul 2020 07:06
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM