Predicción de indicadores primarios de la calidad del agua con redes neuronales LSTM

Zhu, Shibei (2019). Predicción de indicadores primarios de la calidad del agua con redes neuronales LSTM. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. de Sistemas Informáticos (UPM), Madrid.

Description

Title: Predicción de indicadores primarios de la calidad del agua con redes neuronales LSTM
Author/s:
  • Zhu, Shibei
Contributor/s:
  • Gómez Canaval, Sandra
  • Mozo Velasco, Alberto
Item Type: Final Project
Degree: Grado en Ingeniería del Software
Date: July 2019
Subjects:
Freetext Keywords: Redes Neuronales Recurrentes
Faculty: E.T.S.I. de Sistemas Informáticos (UPM)
Department: Sistemas Informáticos
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img] PDF - Users in campus UPM only - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (4MB)

Abstract

El agua es una de las sustancias más importantes para la humanidad. Existen diferentes criterios para la evaluación de la calidad del agua, como el Índice de Calidad del Agua (WQI) y el Índice de estado trófico (TSI). La idea principal de este proyecto es utilizar técnicas de Machine Learning (ML) para dar soporte al proceso de mantenimiento de la calidad del agua sin depender de estos criterios. En actualidad, la monitorización de la evolución de los parámetros primarios del agua es cada vez más fácil gracias al avance en el área de Internet de las Cosas. La generación de una cantidad masiva de información ha posibilitado el uso de estos datos para otro tipo de fines como puede ser la simulación de los comportamientos futuros de estas variables en base de los datos históricos. Las series temporales son un tipo de datos recolectados en un orden cronológico que se usan para realizar este tipo de predicciones. Una serie puede estar afectada por diferentes componentes como pueden ser la tendencia, la variación periódica y el ruido. La idea es predecir la tendencia global de la serie en el futuro en base de los datos históricos. Tradicionalmente, se usan los modelos estadísticos para estas series. Sin embargo, dependiendo de tipo del modelo, puede existir o no un conjunto de requisitos que la serie ha de cumplir. La estacionalidad de la serie hace que ésta sea intratable para algunos modelos, por lo que es necesario usar técnicas como la diferenciación para convertir la serie estacionaria. En los últimos años, las Redes Neuronales Recurrentes han mostrado resultados muy convincentes para el tratamiento de los datos secuenciales. En este Proyecto Fin de Grado, nos hemos dedicado a estudiar la aplicación de la Long short-term memory (LSTM) (un tipo de red neuronal recurrente) sobre datos del agua tomados de forma continua y por tanto temporal, para la generación de predicciones de comportamiento del estado de la calidad de la misma en base a sus parámetros primarios. Se trata de un tipo de modelo que se usa sobretodo en el ámbito de Machine Translation, pero gracias a su capacidad de manejar datos secuenciales, es común encontrarlo también en las predicciones de las series temporales. En este contexto, el objetivo del proyecto es estudiar la capacidad de las LSTM sobre diferentes tamaños de entrada y así como la salida. Para ello, se han realizado diversos experimentos que estudian la importancia de la cantidad de datos históricos sobre el resultado de las predicciones. Abstract: Water is one of the most important substances for humanity. There are different criteria for the evaluation of water quality such as the Water Quality Index (WQI) or the Trophic State Index (TSI). The main idea of this project is to use modern techniques of Machine Learning (ML) to support the maintenance of water quality without relying on these criteria. Nowadays, the monitoring of the evolution of the primary parameters of water is becoming easier thanks to the advance in the Internet of Things field. The generation of a massive amount of data has made possible to use them for other purposes such as simulating the future trends of these variables on the basis of historical data, among others. Time series are a type of data collected in a chronological order that are used to make forecasting of some parameters. These series can be affected by different components such as trend, periodic variation and noise. In this context, the problem is to predict the global trend of the series in the future based on the historical data. Traditionally, statistical models are used for these series. But depending on the type of model, the series has to meet certain criteria or not. The seasonality of the series makes it intractable for some models, so it is necessary techniques such as differentiation to convert it stationary. In recent years, the recurrent neural network has shown very convincing results for the treatment of sequential data. As a result, in this project, we will be focusing on studying the application of Long short-term memory (LSTM), a type of recurrent neural network, on water time series forecasting for primary parameters of the water quality. It is a type of model that is used mainly in the field of Machine Translation, but thanks to its ability to handle sequential data, it is also common to find it in time series forecasting. In this context, the main goal of the project is to study the capacity of the LSTM over different input and output sizes. For this purpose, several experiments have been carried out to study the importance of the amount of historical data on the output of the predictions.

More information

Item ID: 56235
DC Identifier: http://oa.upm.es/56235/
OAI Identifier: oai:oa.upm.es:56235
Deposited by: Biblioteca Universitaria Campus Sur
Deposited on: 02 Sep 2019 05:23
Last Modified: 02 Sep 2019 05:23
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM