Identificación de la planta de edificios mediante segmentación semántica a partir de imágenes del PNOA

Pastor Velasco, Jorge (2025). Identificación de la planta de edificios mediante segmentación semántica a partir de imágenes del PNOA. Trabajo Fin de Grado / Proyecto Fin de Carrera, E.T.S.I. de Sistemas Informáticos (UPM), Madrid.

Descripción

Título: Identificación de la planta de edificios mediante segmentación semántica a partir de imágenes del PNOA
Autor/es:
  • Pastor Velasco, Jorge
Director/es:
Tipo de Documento: Trabajo Fin de Grado o Proyecto Fin de Carrera
Grado: Grado en Ciencia de Datos e Inteligencia Artificial
Fecha: Julio 2025
Materias:
ODS:
Palabras Clave Informales: Segmentación semántica; Redes neuronales convolucionales (CNN); Imágenes aéreas; PNOA; Identificación de edificios; Aprendizaje profundo; Transfer learning
Escuela: E.T.S.I. de Sistemas Informáticos (UPM)
Departamento: Sistemas Informáticos
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[thumbnail of TFG_JORGE_PASTOR_VELASCO.pdf] PDF (Portable Document Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (2MB)

Resumen

Este trabajo presenta el desarrollo y evaluación de distintos sistemas basados en segmentación semántica para la identificación automática de la planta de edificios a partir de ortofotografías aéreas del Plan Nacional de Ortofotografía Aérea (PNOA). El proyecto se enmarca en el uso de técnicas de aprendizaje profundo (DL), particularmente redes neuronales convolucionales (CNNs), aplicadas a imágenes RGB de alta resolución.

Para abordar el problema, se ha realizado un estudio del estado del arte en segmentación semántica binaria, incluyendo una revisión de arquitecturas ampliamente utilizadas como DeepLabV3+, PAN o UPerNet, todas ellas accesibles a través de la librería segmentation models.pytorch. Inicialmente, se ha trabajado con el dataset INRIA para entrenar y comparar diferentes modelos, utilizando métricas como IoU, F1-score, Dice y BCE. A partir de los modelos con mejor desempeño, se ha aplicado transfer learning sobre un conjunto de datos personalizado, creado a partir de imágenes del PNOA proporcionadas por el Instituto Geográfico Nacional (IGN), cuyas máscaras han sido revisadas y validadas manualmente.

Los modelos seleccionados han sido evaluados sobre regiones geográficas de España, para analizar la capacidad de los modelos en condiciones reales y valorar su utilidad para aplicaciones como cartografía, planificación urbana o análisis del territorio.

Abstract:

This work presents the development and evaluation of various systems based on semantic segmentation for the automatic identification of building footprints from aerial orthophotos of the Plan Nacional de Ortofotografía Aérea (PNOA). The project is framed within the use of deep learning (DL) techniques, particularly convolutional neural networks (CNNs), applied to high-resolution RGB imagery.

To address the problem, a study of the state of the art in binary semantic segmentation has been conducted, including a review of widely used architectures such as DeepLabV3+, PAN and UPerNet, all available through the segmentation models.pytorch library. Initially, the INRIA dataset has been used to train and compare different models, employing metrics such as IoU, F1-score, Dice, and BCE. Based on the best-performing models, transfer learning has been applied to a custom dataset created from PNOA images provided by the Instituto Geográfico Nacional (IGN), whose masks have been manually reviewed and validated.

The selected models have been evaluated over geographical regions of Spain to analyze their performance under real-world conditions and to assess their applicability in fields such as cartography, urban planning, or territorial analysis.

Más información

ID de Registro: 90107
Identificador DC: https://oa.upm.es/90107/
Identificador OAI: oai:oa.upm.es:90107
Depositado por: Biblioteca Universitaria Campus Sur
Depositado el: 23 Jul 2025 06:28
Ultima Modificación: 22 Sep 2025 00:45