Identificación, detección y evaluación de rotondas y enlaces mediante algoritmos de aprendizaje profundo en ortofotos del PNOA en la Comunidad de Madrid

Ortiz Tabar, Inmaculada (2024). Identificación, detección y evaluación de rotondas y enlaces mediante algoritmos de aprendizaje profundo en ortofotos del PNOA en la Comunidad de Madrid. Trabajo Fin de Grado / Proyecto Fin de Carrera, E.T.S.I. en Topografía, Geodesia y Cartografía (UPM), Madrid.

Descripción

Título: Identificación, detección y evaluación de rotondas y enlaces mediante algoritmos de aprendizaje profundo en ortofotos del PNOA en la Comunidad de Madrid
Autor/es:
  • Ortiz Tabar, Inmaculada
Director/es:
Tipo de Documento: Trabajo Fin de Grado o Proyecto Fin de Carrera
Grado: Grado en Ingeniería de las Tecnologías de la Información Geoespacial
Fecha: Julio 2024
Materias:
Palabras Clave Informales: Aprendizaje profundo, redes neuronales convolucionales, etiquetado de imágenes, detección rotondas, detección enlaces, Deep Learning, convolutional neural networks, image labeling, roundabouts detection, junction detection
Escuela: E.T.S.I. en Topografía, Geodesia y Cartografía (UPM)
Departamento: Ingeniería Topográfica y Cartografía
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[thumbnail of TFG_INMACULADA_ORTIZ_TABAR.pdf] PDF (Portable Document Format) - Acceso permitido solamente al administrador del Archivo Digital UPM - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (2MB)

Resumen

Este trabajo fin de grado se centra en la detección de las rotondas y enlaces que se pueden encontrar en ortoimágenes aéreas del Plan Nacional de Ortofotografía Aérea (PNOA).
Se presentan los conceptos más importantes relacionados con la inteligencia artificial, aprendizaje automático y el aprendizaje profundo y se aplican redes neuronales especializadas en la detección de objetos (basadas en redes convolucionales) para la detección y clasificación de objetos geoespaciales (rotondas y enlaces) en ortoimágenes aéreas.

Se parte de un conjunto de datos etiquetado con información sobre rotondas y enlaces utilizando LabelMe, además de varios scripts iniciales para la descarga de imágenes o la orientación de las etiquetas. Después, se entrenan variantes de YOLOv8 para detectar los objetos geoespaciales estudiados en las ortoimágenes.

El trabajo se centra en el entrenamiento, testeo y validación de las diversa simágenes con los modelos de YOLOv8. Se prueban modelos que utilizan las etiquetas orientadas y modelos que no las usan. Por otro lado, se analizan las métricas más importantes y se elige el modelo más adecuado para el problema, el cual posteriormente se utilizará para predecir las diferentes clases en imágenes del Plan Nacional de Ortofotografía Aérea en la Comunidad de Madrid. Posteriormente se valora el rendimiento y funcionamiento del modelo para observar sus limitaciones.

Por último, este trabajo también se enfoca en analizar que estructura debe seguir un fichero JSON para que siga con el estándar TrainingDML-AI. Con ello, se consigue un fichero JSON con las etiquetas utilizadas en este proyecto.

Abstract:

This final degree project focuses on the detection of roundabouts and junctions found in aerial orthoimages from the National Plan for Aerial Orthophotography (PNOA).

The most important concepts related to artificial intelligence, machine learning, and deep learning are presented, and neural networks specialized in object detection (based on convolutional networks) are applied for the detection and classification of geospatial objects (roundabouts and junctions) in aerial orthoimages.

The project starts with a labelled dataset containing information about roundabouts and junctions using LabelMe, along with several initial scripts for downloading images or orienting the labels. Then, variants of YOLOv8 are trained to detect the geospatial objects studied in the orthoimages.

The work focuses on training, testing, and validating the various images with YOLOv8 models. Models using oriented labels and models that do not use them are tested. On the other hand, the most important metrics are analysed, and the most suitable model for the problem is selected, which will later be used to predict the different classes in images from the National Plan for Aerial Orthophotography in the Community of Madrid. Subsequently, the performance and functionality of the model are evaluated to observe its limitations.

Finally, this project also focuses on analysing the structure a JSON file should follow to comply with the TrainingDML-AI standard. As a result, a JSON file with the labels used in this project is created.

Más información

ID de Registro: 85200
Identificador DC: https://oa.upm.es/85200/
Identificador OAI: oai:oa.upm.es:85200
Depositado por: Biblioteca Universitaria Campus Sur
Depositado el: 03 Dic 2024 18:22
Ultima Modificación: 03 Dic 2024 18:22