Umbrales de decisión en clasificación no supervisada de imágenes de satélite

García Díaz, Adrián (2023). Umbrales de decisión en clasificación no supervisada de imágenes de satélite. Trabajo Fin de Grado / Proyecto Fin de Carrera, E.T.S. de Ingenieros Informáticos (UPM), Boadilla del Monte.

Descripción

Título: Umbrales de decisión en clasificación no supervisada de imágenes de satélite
Autor/es:
  • García Díaz, Adrián
Director/es:
Tipo de Documento: Trabajo Fin de Grado o Proyecto Fin de Carrera
Grado: Grado en Matemáticas e Informática
Fecha: Julio 2023
Materias:
ODS:
Escuela: E.T.S. de Ingenieros Informáticos (UPM)
Departamento: Arquitectura y Tecnología de Sistemas Informáticos
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[thumbnail of TFG_ADRIAN_GARCIA_DIAZ.pdf] PDF (Portable Document Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (38MB)

Resumen

El proyecto se centra en la comparación de dos algoritmos de clasificación no supervisada de imágenes de satélite. Para iniciar el proyecto, se seleccionó el Lago Natron en el Gran Valle del Rift, Tanzania. Este lago fue elegido debido a sus características distintivas, que ofrecen un objeto de estudio peculiar e interesante, y permiten una comparación efectiva entre los algoritmos. Para llevar a cabo el estudio de los cambios en este lago, se recopilaron imágenes de satélite utilizando la herramienta proporcionada por Sentinel Hub EO Browser. Se obtuvieron las imágenes de las bandas del espectro electromagnético que se utilizarán en el análisis, incluyendo la banda 2 (color azul, longitud de onda entre 0.45µm y 0.52µm), la banda 3 (color verde, longitud de onda entre 0.54µm y 0.57µm), la banda 4 (color rojo, longitud de onda entre 0.65µm y 0.68µm) y la banda 8 (infrarrojo cercano, longitud de onda entre 0.78µm y 0.90µm). Además, se realizó un estudio previo para identificar las mejores fechas en las que las imágenes no estuvieran afectadas por elementos como nubes u otros fenómenos que pudieran dificultar el análisis. Una vez obtenidas las mejores fechas y descargadas las imágenes correspondientes a las bandas mencionadas, se generaron las imágenes de “Color Verdadero” y “Falso Color” para cada fecha. La composición de “Color Verdadero” se realizó utilizando las bandas 4, 3 y 2 en los canales RGB, mientras que la composición de “Falso Color” se realizó utilizando las bandas 8, 4 y 3 en los mismos canales en ese orden. Posteriormente, se calculó el Índice de Agua Normalizado (NDWI) para cada fecha, el cual ayuda a diferenciar las áreas acuosas en las imágenes. Para calcular el NDWI, se utilizaron las bandas 3 y 8, y se aplicaron cálculos algebraicos en las imágenes utilizando software adecuado. Luego, se aplicó la umbralización multinivel Otsu a las imágenes NDWI obtenidas, lo que permitió obtener las regiones o clases de estudio que representan los diferentes tipos de terreno presentes en las imágenes. También se obtuvieron las imágenes correspondientes a los mapas temáticos, donde cada clase se asignó un color específico. A lo largo del proceso, se recopilaron datos relacionados con la cantidad de píxeles en cada imagen, los cuales serán utilizados para estudios posteriores. Una vez finalizado el procesamiento de la imagen completa, se repitió el mismo procedimiento para la imagen del interior del lago. Para ello, se delimitó la región del lago utilizando el KML (Keyhole Markup Language), un lenguaje de marcado basado en XML utilizado para representar datos geográficos) correspondiente y se utilizaron herramientas como Google Earth y Sentinel Hub EO Browser para obtener únicamente las imágenes del interior del lago con las bandas necesarias. Para verificar el procesamiento utilizado y realizar una comparación entre los dos algoritmos, se aplicó un clasificador no supervisado tradicional utilizando la aplicación SNAP, que permite el procesamiento de imágenes satelitales del Sentinel. Se utilizaron las imágenes NDWI generadas y se aplicó el algoritmo de clasificación K-means para obtener las regiones y los mapas temáticos correspondientes. El objetivo fue lograr colores y regiones similares en ambos algoritmos para una comparación precisa. Además del Lago Natron, se seleccionó un embalse español, el embalse de Iznájar, ubicado entre Córdoba, Granada y Málaga, para realizar el mismo procesamiento de imágenes. Este embalse fue elegido debido a su bajo nivel de agua actual.

ABSTRACT

The project focuses on the comparison of two unsupervised image classification algorithms for satellite imagery. To initiate the project, Lake Natron in the Great Rift Valley, Tanzania, was selected. This lake was chosen due to its distinctive characteristics, which provide a unique and interesting study object and enable an effective comparison between the algorithms. To carry out the study of changes in this lake, satellite images were collected using the tool provided by Sentinel Hub EO Browser. Images from the electromagnetic spectrum bands to be used in the analysis were obtained, including band 2 (blue color, wavelength between 0.45 micrometers and 0.52 micrometers), band 3 (green color, wavelength between 0.54 micrometers and 0.57 micrometers), band 4 (red color, wavelength between 0.65 micrometers and 0.68 micrometers), and band 8 (near-infrared, wavelength between 0.78 micrometers and 0.90 micrometers). Furthermore, a preliminary study was conducted to identify the best dates when the images were not affected by elements such as clouds or other phenomena that could hinder the analysis. Once the optimal dates were determined and the corresponding images for the mentioned bands were downloaded, “True Color” and “False Color” images were generated for each date. The “True Color” composition was created using bands 4, 3, and 2 in the RGB channels, while the “False Color” composition was created using bands 8, 4, and 3 in the same order. Subsequently, the Normalized Difference Water Index (NDWI) was calculated for each date, which helps differentiate water areas in the images. To calculate the NDWI, bands 3 and 8 were used, and algebraic calculations were applied to the images using suitable software. Then, Otsu’s multi-level thresholding was applied to the obtained NDWI images, allowing the identification of study regions or classes representing different types of terrain present in the images. Corresponding thematic maps were also generated, where each class was assigned a specific color. Throughout the process, data related to the pixel count in each image were collected, which will be used for further studies. Once the processing of the entire image was completed, the same procedure was repeated for the interior of the lake. The lake region was delimited using the corresponding KML (Keyhole Markup Language) file, and tools such as Google Earth and Sentinel Hub EO Browser were utilized to obtain only the images of the lake interior with the necessary bands. To verify the processing used and make a comparison between the two algorithms, a traditional unsupervised classifier was applied using the SNAP application, which allows the processing of Sentinel satellite images. The generated NDWI images were used, and the K-means classification algorithm was applied to obtain the regions and corresponding thematic maps. The objective was to achieve similar colors and regions in both algorithms for an accurate comparison. In addition to Lake Natron, a spanish water reservoir, the Iznájar Reservoir, located between Córdoba, Granada, and Málaga, was selected to undergo the same image processing. This reservoir was chosen due to its current low water level.

Más información

ID de Registro: 75552
Identificador DC: https://oa.upm.es/75552/
Identificador OAI: oai:oa.upm.es:75552
Depositado por: Biblioteca Facultad de Informatica
Depositado el: 03 Ago 2023 11:12
Ultima Modificación: 03 Ago 2023 11:12