Texto completo
|
PDF (Portable Document Format)
- Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (2MB) |
| Título: | Identificación de la planta de edificios mediante segmentación semántica a partir de imágenes del PNOA |
|---|---|
| Autor/es: |
|
| Director/es: |
|
| Tipo de Documento: | Trabajo Fin de Grado o Proyecto Fin de Carrera |
| Grado: | Grado en Ciencia de Datos e Inteligencia Artificial |
| Fecha: | Julio 2025 |
| Materias: | |
| ODS: | |
| Palabras Clave Informales: | Segmentación semántica; Redes neuronales convolucionales (CNN); Imágenes aéreas; PNOA; Identificación de edificios; Aprendizaje profundo; Transfer learning |
| Escuela: | E.T.S.I. de Sistemas Informáticos (UPM) |
| Departamento: | Sistemas Informáticos |
| Licencias Creative Commons: | Reconocimiento - Sin obra derivada - No comercial |
|
PDF (Portable Document Format)
- Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (2MB) |
Este trabajo presenta el desarrollo y evaluación de distintos sistemas basados en segmentación semántica para la identificación automática de la planta de edificios a partir de ortofotografías aéreas del Plan Nacional de Ortofotografía Aérea (PNOA). El proyecto se enmarca en el uso de técnicas de aprendizaje profundo (DL), particularmente redes neuronales convolucionales (CNNs), aplicadas a imágenes RGB de alta resolución.
Para abordar el problema, se ha realizado un estudio del estado del arte en segmentación semántica binaria, incluyendo una revisión de arquitecturas ampliamente utilizadas como DeepLabV3+, PAN o UPerNet, todas ellas accesibles a través de la librería segmentation models.pytorch. Inicialmente, se ha trabajado con el dataset INRIA para entrenar y comparar diferentes modelos, utilizando métricas como IoU, F1-score, Dice y BCE. A partir de los modelos con mejor desempeño, se ha aplicado transfer learning sobre un conjunto de datos personalizado, creado a partir de imágenes del PNOA proporcionadas por el Instituto Geográfico Nacional (IGN), cuyas máscaras han sido revisadas y validadas manualmente.
Los modelos seleccionados han sido evaluados sobre regiones geográficas de España, para analizar la capacidad de los modelos en condiciones reales y valorar su utilidad para aplicaciones como cartografía, planificación urbana o análisis del territorio.
Abstract:
This work presents the development and evaluation of various systems based on semantic segmentation for the automatic identification of building footprints from aerial orthophotos of the Plan Nacional de Ortofotografía Aérea (PNOA). The project is framed within the use of deep learning (DL) techniques, particularly convolutional neural networks (CNNs), applied to high-resolution RGB imagery.
To address the problem, a study of the state of the art in binary semantic segmentation has been conducted, including a review of widely used architectures such as DeepLabV3+, PAN and UPerNet, all available through the segmentation models.pytorch library. Initially, the INRIA dataset has been used to train and compare different models, employing metrics such as IoU, F1-score, Dice, and BCE. Based on the best-performing models, transfer learning has been applied to a custom dataset created from PNOA images provided by the Instituto Geográfico Nacional (IGN), whose masks have been manually reviewed and validated.
The selected models have been evaluated over geographical regions of Spain to analyze their performance under real-world conditions and to assess their applicability in fields such as cartography, urban planning, or territorial analysis.
| ID de Registro: | 90107 |
|---|---|
| Identificador DC: | https://oa.upm.es/90107/ |
| Identificador OAI: | oai:oa.upm.es:90107 |
| Depositado por: | Biblioteca Universitaria Campus Sur |
| Depositado el: | 23 Jul 2025 06:28 |
| Ultima Modificación: | 22 Sep 2025 00:45 |
Publicar en el Archivo Digital desde el Portal Científico