Texto completo
|
PDF (Portable Document Format)
- Acceso permitido solamente a usuarios en el campus de la UPM
- Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (6MB) |
| Título: | Aplicabilidad de técnicas de aprendizaje no supervisado (redes adversarias generativas condicionales) para la extracción de la señalización horizontal en viales asfaltados |
|---|---|
| Autor/es: |
|
| Director/es: |
|
| Tipo de Documento: | Trabajo Fin de Grado o Proyecto Fin de Carrera |
| Grado: | Grado en Ingeniería de las Tecnologías de la Información Geoespacial |
| Fecha: | Junio 2023 |
| Materias: | |
| ODS: | |
| Palabras Clave Informales: | Aprendizaje profundo, Redes antagónicas generativas, Extracción multiclase, Señalización vial horizontal, Ortoimágenes, Pix2Pix, TensorFlow, Inteligencia artificial |
| Escuela: | E.T.S.I. en Topografía, Geodesia y Cartografía (UPM) |
| Departamento: | Ingeniería Topográfica y Cartografía |
| Licencias Creative Commons: | Reconocimiento - Sin obra derivada - No comercial |
|
PDF (Portable Document Format)
- Acceso permitido solamente a usuarios en el campus de la UPM
- Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (6MB) |
Resumen:
Este trabajo fin de grado presenta un enfoque basado en aprendizaje profundo e inteligencia artificial para la extracción multiclase de señalización horizontal de líneas de carretera presente en las ortofotografías utilizando aprendizaje no supervisado y redes generativas adversarias (GANs). En el ámbito de la visión computacional, el aprendizaje profundo ha demostrado ser sumamente efectivo en tareas como la segmentación semántica, donde se pretende etiquetar cada píxel de una imagen con la etiqueta o clase correspondiente a la que pertenece.
Para llevar a cabo esta tarea se realizaron dos experimentos utilizando el modelo Pix2Pix de TensorFlow, un reconocido framework de código abierto desarrollado por Google Brain Team que facilita la construcción y entrenamiento de modelos de aprendizaje profundo. El modelo Pix2Pix es una red generativa adversaria condicional (cGANs) que utiliza una estructura de codificador-decodificador para aprender a transformar imágenes de entrada en imágenes de salida deseadas.
El Experimento_1 se basa en el modelo Pix2Pix predeterminado el cual alcanzó un 41% de precisión en el coeficiente de Jaccard (IoU score) al evaluar su capacidad de realizar tareas de segmentación semántica multiclase de líneas de carretera presentes en las ortofotografías. El Experimento_2, por su parte, introdujo modificaciones en la arquitectura del Generador, añadiendo una capa de muestreo ascendente y otra de muestreo descendente, así como el incremento del valor del hiper-parámetro LAMBDA de 100 a 1000. Esto resultó en una mejora significativa en la precisión obtenida en el en el coeficiente de Jaccard (IoU score), alcanzando un 60% (un incremento de un 19% respecto al experimento anterior).
Los resultados obtenidos indican un avance sustancial en la identificación de líneas discontinuas gruesas, líneas discontinuas centrales y líneas continuas laterales en las ortofotografías, evidenciando la eficacia del aprendizaje profundo no supervisado y la inteligencia artificial en la extracción de características en imágenes aéreas. Este enfoque, fundamentado en Pix2Pix y GANs abre nuevas posibilidades para futuras investigaciones y aplicaciones en el ámbito de la visión computacional y el análisis de imágenes geoespaciales, contribuyendo a la literatura científica y al desarrollo de nuevas metodologías como la segmentación semántica multiclase en el campo del análisis geoespacial.
Abstract:
This end-of-studies project presents a deep learning and artificial intelligence-based approach for multi-class extraction of horizontal road markings in orthophotos using unsupervised learning and generative adversarial networks (GANs). In computer vision, deep learning has proven remarkably effective in tasks such as semantic segmentation, where the goal is to label each pixel of an image with the corresponding tag or class to which it belongs.
To accomplish this task, two experiments were conducted using the Pix2Pix model of TensorFlow, a renowned open-source framework developed by the Google Brain Team that facilitates the construction and training of deep learning models. The Pix2Pix model is a conditional generative adversarial network (cGANs) that uses an encoderdecoder architecture to learn how to transform input images into desired output images.
Experiment 1 is based on the standard Pix2Pix model, which achieved 41% accuracy in the Jaccard coefficient (IoU score) when evaluating its ability to perform multi-class semantic segmentation tasks on road markings present in orthophotos. Experiment 2, on the other hand, introduced modifications to the Generator's architecture by adding an upsampling layer and a downsampling layer, as well as increasing the value of the LAMBDA hyperparameter from 100 to 1000. This resulted in a significant improvement in the Jaccard coefficient (IoU score), reaching 60% accuracy (a 19% increase compared to the previous experiment).
The results obtained show significant progress in the identification of thick dashed lines, central dashed lines, and continuous lateral lines in orthophotos, demonstrating the effectiveness of unsupervised deep learning and artificial intelligence in extracting features from aerial imagery. This approach, based on Pix2Pix and GANs, opens new possibilities for future research and applications in the field of computer vision and geospatial image analysis, contributing to the scientific literature and the development of novel methodologies such as multi-class semantic segmentation in the field of geospatial analysis.
| ID de Registro: | 80280 |
|---|---|
| Identificador DC: | https://oa.upm.es/80280/ |
| Identificador OAI: | oai:oa.upm.es:80280 |
| Depositado por: | Biblioteca Universitaria Campus Sur |
| Depositado el: | 19 Feb 2024 20:18 |
| Ultima Modificación: | 19 Feb 2024 20:18 |
Publicar en el Archivo Digital desde el Portal Científico