@unpublished{upm669, note = {Unpublished}, year = {2007}, school = {Caminos}, title = {Pron{\'o}stico probabil{\'i}stico de caudales de avenida mediante redes bayesianas aplicadas sobre un modelo hidrol{\'o}gico distribuido}, doi = {10.20868/UPM.thesis.669}, url = {https://oa.upm.es/669/}, author = {Mediero Ordu{\~n}a, Luis Jes{\'u}s}, abstract = {RESUMEN La presente tesis muestra el desarrollo de un modelo de pron{\'o}stico probabil{\'i}stico de caudales con aplicaci{\'o}n al proceso de toma de decisiones en una situaci{\'o}n real de avenidas. El modelo de pron{\'o}stico se fundamenta en la combinaci{\'o}n de un conjunto de herramientas que permiten la simulaci{\'o}n del comportamiento hidrol{\'o}gico de la cuenca y un modelo de redes Bayesianas que permite captar la variabilidad e incertidumbre de los procesos hidrol{\'o}gicos desde un punto de vista probabil{\'i}stico. El modelo de pron{\'o}stico suministra distribuciones de probabilidad de ocurrencia del caudal para diferentes intervalos de tiempo en el futuro, a partir de las condiciones iniciales en la cuenca y la lluvia antecedente. El comportamiento hidrol{\'o}gico de la cuenca ha sido representado mediante la conjunci{\'o}n de un modelo hidrol{\'o}gico distribuido que simula el proceso lluvia escorrent{\'i}a, un modulo de embalses que permite simular el proceso de laminaci{\'o}n en los mismos a partir de los resultados del modelo distribuido y un m{\'o}dulo de transporte de caudal que simula el comportamiento en los cauces. De todos estos procesos, el de lluvia-escorrent{\'i}a es el m{\'a}s determinante, as{\'i} como el que conlleva una mayor incertidumbre. El modelo de pron{\'o}stico se fundamenta en la representaci{\'o}n de una cuenca hidrol{\'o}gica mediante la aplicaci{\'o}n de un m{\'e}todo de aprendizaje basado en casos. Si consideramos un sistema que produce un efecto a partir de unos est{\'i}mulos, el m{\'e}todo de aprendizaje basado en casos debe considerar todos los posibles est{\'i}mulos que puede tener el sistema, as{\'i} como todos los comportamientos que puede presentar el sistema y que dar{\'a}n lugar a diferentes efectos a partir de un mismo est{\'i}mulo, con el objetivo de considerar todos los posibles casos que se pueden dar en dicho sistema. Para el caso de un sistema hidrol{\'o}gico que representa el comportamiento hidrol{\'o}gico de una cuenca, el est{\'i}mulo ser{\'a} la lluvia y el efecto ser{\'a} el caudal. Por tanto, se deber{\'a}n considerar todos los posibles eventos de lluvia que se pueden dar en la cuenca, obteniendo el efecto o hidrograma de caudales que produce cada uno de ellos, teniendo en cuenta los diferentes comportamientos hidrol{\'o}gicos que puede adoptar la cuenca. Se ha obtenido el conjunto de posibles eventos de lluvia que se pueden dar en la cuenca mediante la utilizaci{\'o}n de un simulador estoc{\'a}stico de generaci{\'o}n de lluvia. Esta herramienta permite generar episodios de lluvia de forma aleatoria a partir de una serie de par{\'a}metros que determinan las caracter{\'i}sticas generales del tipo de lluvia. La consideraci{\'o}n de unos valores fijos de los par{\'a}metros del modelo, llevan a la obtenci{\'o}n de diferentes eventos de lluvia con una caracter{\'i}sticas generales similares de tipolog{\'i}a (convectiva, orogr{\'a}fica, etc.) y de orden de magnitud de lluvia m{\'a}xima. Mediante la caracterizaci{\'o}n de estos par{\'a}metros con funciones de densidad de probabilidad, a partir, de las caracter{\'i}sticas de los episodios de lluvia registrados en una cuenca concreta, se ha obtenido un conjunto de eventos de lluvia con las diferentes tipolog{\'i}as de lluvia que se pueden dar en la cuenca y con diferentes {\'o}rdenes de magnitud de los valores de la lluvia m{\'a}xima, lluvia media y duraci{\'o}n de la tormenta. El comportamiento hidrol{\'o}gico de la cuenca ha sido simulado mediante la utilizaci{\'o}n de un modelo hidrol{\'o}gico de tipo distribuido, ya que {\'e}ste presenta una serie de ventajas sobre un modelo de tipo agregado, como son la consideraci{\'o}n de una lluvia distribuida en el espacio en lugar de un valor de lluvia media en la cuenca, la utilizaci{\'o}n de par{\'a}metros con valores distribuidos tambi{\'e}n en el espacio y la representaci{\'o}n de los procesos hidrol{\'o}gicos mediante ecuaciones que presentan un mayor acercamiento al comportamiento f{\'i}sico real de la cuenca. Un m{\'e}todo de aprendizaje basado en casos exige la consideraci{\'o}n de los posibles tipos de comportamiento hidrol{\'o}gico que se pueden dar en la cuenca. Un modelo hidrol{\'o}gico utiliza una serie de par{\'a}metros para caracterizar el comportamiento de la cuenca, cuyos valores se obtienen tras un proceso de calibraci{\'o}n del modelo. El resultado de la calibraci{\'o}n obtiene normalmente un valor para cada par{\'a}metro, que en conjunto permite la realizaci{\'o}n de simulaciones cercanas a los hidrogramas observados. La consideraci{\'o}n de valores fijos de los par{\'a}metros nos permite simular un comportamiento hidrol{\'o}gico medio de la cuenca, que se ajusta en mayor o menor medida a los comportamientos registrados mediante los episodios observados. Sin embargo, la obtenci{\'o}n de funciones de densidad de probabilidad de los valores de los par{\'a}metros, permite considerar los diferentes tipos de comportamiento hidrol{\'o}gico de la cuenca, a la vez que tiene en cuenta el error cometido por el modelo al no realizar una simulaci{\'o}n perfecta de la realidad sino una descripci{\'o}n aproximada. Se ha presentado una metodolog{\'i}a de calibraci{\'o}n h{\'i}brida de un modelo hidrol{\'o}gico distribuido, mediante la combinaci{\'o}n de una calibraci{\'o}n manual para la obtenci{\'o}n de los par{\'a}metros que caracterizan los diferentes tipos de suelo y una calibraci{\'o}n autom{\'a}tica para determinar las funciones de densidad de probabilidad que caracterizan el resto de los par{\'a}metros. La calibraci{\'o}n autom{\'a}tica se ha realizado sobre los resultados de la simulaci{\'o}n repetitiva del modelo hidrol{\'o}gico distribuido, con valores fijos de los par{\'a}metros del suelo y valores del resto de par{\'a}metros obtenidos como resultado de una simulaci{\'o}n de Monte Carlo mediante distribuciones uniformes de probabilidad. Se ha seleccionado el conjunto de funciones objetivo, estimadores que analizan la comparaci{\'o}n de los valores simulados con los datos observados, que mejor captan la influencia del error cometido por cada uno de los par{\'a}metros y se han obtenido las soluciones de Pareto que minimizan las funciones objetivo seleccionadas. Las funciones de densidad de probabilidad que mejor caracterizan la variabilidad de las soluciones de Pareto para cada par{\'a}metro han sido utilizadas para caracterizarlos y as{\'i} representar los diferentes comportamientos hidrol{\'o}gicos de la cuenca. La obtenci{\'o}n de los posibles hidrogramas que se pueden dar en la cuenca ha sido realizada mediante la simulaci{\'o}n repetitiva del modelo hidrol{\'o}gico distribuido, tomando como datos de entrada los eventos sint{\'e}ticos de lluvia obtenidos con el simulador estoc{\'a}stico de lluvia y unas condiciones iniciales en la cuenca aleatorias. Cada simulaci{\'o}n del modelo hidrol{\'o}gico toma unos valores diferentes de los par{\'a}metros, mediante la realizaci{\'o}n de una simulaci{\'o}n de Monte Carlo sobre las funciones de densidad de probabilidad que caracterizan a cada uno de ellos. Esta simulaci{\'o}n de los posibles casos hidrol{\'o}gicos que se pueden dar en la cuenca en r{\'e}gimen natural, han sido transformados en casos en r{\'e}gimen alterado, mediante la utilizaci{\'o}n de un m{\'o}dulo de embalses, que simula el proceso de laminaci{\'o}n en los embalses existentes en la cuenca, con unas condiciones iniciales de nivel de embalse y una estrategia de operaci{\'o}n de los {\'o}rganos de desag{\"u}e aleatorias. Toda esta cantidad de datos sint{\'e}ticos generados ha sido tratada mediante redes Bayesianas. Una red Bayesiana es un mecanismo de inferencia, generado dentro del campo de la Inteligencia Artificial, que permite la definici{\'o}n de distribuciones de probabilidad. Una red Bayesiana est{\'a} formada por un conjunto de nodos y arcos. Los nodos representan las variables que tienen mayor influencia sobre un proceso y los arcos las relaciones de dependencia existentes entre ellas. El conjunto de nodos y arcos que representan un determinado proceso se denomina topolog{\'i}a de red Bayesiana. Cada uno de los procesos que intervienen en la caracterizaci{\'o}n del proceso hidrol{\'o}gico de una cuenca ha sido representado mediante una topolog{\'i}a de red Bayesiana, por tanto, se han determinado las topolog{\'i}as de red Bayesiana que permiten representar los procesos de lluvia-escorrent{\'i}a, operaci{\'o}n de embalses y transporte de caudal, teniendo en cuenta en cada caso las caracter{\'i}sticas de cada subcuenca, embalse y cauce considerado. Las redes Bayesianas creadas han sido aprendidas con un primer conjunto de datos sint{\'e}ticos, a partir de la discretizaci{\'o}n y transformaci{\'o}n en valores cualitativos de los valores de las diferentes variables consideradas, obteniendo los par{\'a}metros o tablas de probabilidades condicionadas para cada uno de los nodos de las redes. La validez de estos par{\'a}metros y de cada una de las redes Bayesianas ha sido verificada mediante la aplicaci{\'o}n de una metodolog{\'i}a de validaci{\'o}n generada en funci{\'o}n de la cuantificaci{\'o}n de la calidad de los atributos que influyen en la calidad de un pron{\'o}stico probabil{\'i}stico y la obtenci{\'o}n de los valores de calidad global para cada una de las redes Bayesianas. La metodolog{\'i}a ha sido aplicada a la cuenca del r{\'i}o Manzanares, mediante la conjunci{\'o}n del simulador estoc{\'a}stico de lluvia SimTorm y el modelo hidrol{\'o}gico distribuido RIBS. Se han generado dos conjuntos de 8700 episodios sint{\'e}ticos con una longitud de 155 intervalos de tiempo, que constituyen 1.348.500 valores para cada una de las variables. El primer conjunto se ha utilizado para realizar el proceso de aprendizaje de las redes Bayesianas y el segundo conjunto para realizar el proceso de validaci{\'o}n. La validaci{\'o}n del modelo ha dado como resultado una utilidad satisfactoria del modelo probabil{\'i}stico de pron{\'o}stico basado en redes Bayesianas como herramienta de ayuda en una situaci{\'o}n de avenida. Finalmente se ha presentado la aplicaci{\'o}n del modelo probabil{\'i}stico de pron{\'o}stico basado en redes Bayesianas como herramienta de ayuda en el proceso de toma de decisiones de la mejor estrategia de operaci{\'o}n de los {\'o}rganos de desag{\"u}e de un embalse, durante la ocurrencia de un episodio real de avenidas. El modelo permite seleccionar la mejor estrategia de operaci{\'o}n en funci{\'o}n del riesgo asumido tanto de da{\~n}os en la propia presa como de da{\~n}os en el cauce aguas abajo. ABSTRACT A probabilistic flood forecasting model has been developed, which can be used as a making-decision tool in a real-time flood event. This forecast model joins several models, to simulate hydrological basin behaviour, with a Bayesian network model, to capture variability and uncertainty of hydrological processes, giving as result occurrence probability distributions of discharges in the future, from antecedent basin conditions and past rainfall. Hydrological basin behaviour has been represented by joining a distributed rainfall-runoff model, a reservoir operation model, to simulate flood control processes from the distributed model results, and a routing model, to simulate flow in reaches. The forecast model is based on a learning method from cases as a tool for modelling the processes that occurs in a hydrological basin. This method must take into account all the possible situations that could arise in the system. All possible rainfall events and hydrological basin behaviours must be simulated, achieving a set of hydrographs as result of different combinations of rainfall events and hydrological behaviours. Possible rainfall events have been obtained from a stochastic rainfall generator, which simulates random rainfall episodes from a set of parameters that describes the characteristics of the storm. Representation of these parameters by fixed values implies generation of rainfall episodes with the same characteristics (convective or orographic or etc.) and similar amount of maximum rainfall. However, parameters have been represented by probability density functions, defined from the observed rainfall events in the basin, implying the generation of a set of rainfall episodes with different typologies and different amounts of maximum and mean rainfall and storm duration. Hydrological basin behaviour has been simulated through a distributed rainfall-runoff model, because of advantages presented by this kind of models over lumped models, as utilization of spatially distributed rainfalls indeed mean rainfall, utilization of spatially distributed values of model parameters and representation of hydrological processes through equations that are assumed to be a near approach to the real physic processes occurred on the basin. A learning method from cases implies taking into account all possible hydrological basin behaviours. Hydrological models describe basin behaviours through parameters that are adjusted by calibration processes, which usually give as result a fixed value for each parameter. This approach will make simulations with the mean basin behaviour from all observed behaviours. Rainfall-runoff model parameters have been characterized by probability density functions, taking into account all possible basin behaviours and modelling errors, the latter caused by an imperfect model simulation of the reality. A hybrid calibration methodology for distributed rainfall-runoff models is presented, coupling manual calibration, to achieve the parameters values of the soil characteristics, and automatic calibration, to obtain the probability density functions of the other parameters. Automatic calibration has been applied to the result of a repetitive simulation run of the distributed rainfallrunoff model. Monte-Carlo simulations have been carried out with fixed values of the soil characteristics parameters and random values of the remaining parameters. Errors between observed and simulated data have been quantified by a set of objective functions, obtaining the Pareto solutions that minimize those objective functions. Probability density functions have been defined from these Pareto solutions for each parameter. Abstract A second repetitive simulation run of the distributed rainfall-runoff model has been executed to obtain the set of possible hydrographs that could arise in the basin, taking the set of generated random rainfall episodes and random antecedent basin conditions as input. Every simulation takes different values of the rainfall-runoff parameters by a Monte Carlo simulation over the calibrated probability density functions. The reservoir operation model has been used to simulate flood control processes, by random initial reservoir level and operation strategy as input. Bayesian networks have been learned from all these synthetic data. Bayesian networks are inference machines, generated from the Artificial Intelligence field, which are built by nodes, to represent system variables, and arcs, to represent causal relations between them. A set of nodes and arcs, which represent a process or a system, are named as a Bayesian network topology. Each process of the hydrological basin behaviour (rainfall-runoff process, reservoir operation and flow routing) has been represented through a Bayesian network topology, taking into account own characteristics of every subbasin, reservoir or reach. Bayesian networks have been learned from discretized values of the first set of synthetic events, achieving the parameters or conditional probability tables for all nodes of a network topology. These parameters have been evaluated by a verification methodology, which is based on the quantification of the quality of the attributes that influence on the global quality of a probabilistic forecast. The proposed methodology has been applied to the Manzanares river basin by coupling the SimTorm stochastic rainfall generator and the RIBS distributed rainfall-runoff model. Two sets of 8,700 synthetic flood events have been generated, with 155 time steps per event, giving as result 1,348,500 values for each variable. The first set has been utilized for the learning process of Bayesian networks and the second set for the verification process. Verification process of the probabilistic forecast model has been satisfactory and has concluded that the developed probabilistic forecast model can be applied as a decision-making tool in a real-time flood event. Finally, an application of the probabilistic forecast model based on Bayesian networks as a decision-making tool for the selection of the best reservoir operation strategy, in terms of assumed risk of both downstream damages and dam structural damages, in real-time operation has been presented.} }