Predicción de precios de energía eléctrica utilizando árboles dinámicos

Remón Ugarte, Adrián (2017). Predicción de precios de energía eléctrica utilizando árboles dinámicos. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. Industriales (UPM), Madrid.

Descripción

Título: Predicción de precios de energía eléctrica utilizando árboles dinámicos
Autor/es:
  • Remón Ugarte, Adrián
Director/es:
  • González Fernández, María Camino
  • Mira McWilliams, José Manuel
Tipo de Documento: Proyecto Fin de Carrera/Grado
Grado: Grado en Ingeniería en Tecnologías Industriales
Fecha: 2017
Materias:
Palabras Clave Informales: Data Mining, árboles dinámicos, árboles de clasificación, árboles de regresión, Random Forests, Conditional Inference Trees, Dynamic Trees, análisis univariante
Escuela: E.T.S.I. Industriales (UPM)
Departamento: Ingeniería de Organización, Administración de Empresas y Estadística
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (10MB) | Vista Previa

Resumen

El mercado eléctrico español, formado por todos los generadores, productores, transportistas, distribuidores, comercializadores, consumidores, reguladores y operadores y sus infraestructuras, asegura y regula el acceso y la producción de energía eléctrica en nuestro país. Al no ser la electricidad un bien almacenable en grandes cantidades, es muy importante que producción y consumo sean simultáneos. El precio de la electricidad en España se fija mediante subasta. Primero entran al pool las tecnologías que por su menor coste venden la electricidad a un precio menor, seguidas por la siguiente tecnología más barata y así sucesivamente hasta cubrir la demanda prevista. Una vez logrado esto, a todos los productores se les paga el precio al que vende su electricidad la última tecnología puesta en juego denominado precio marginal que resulta de la casación de precio de una hora cualquiera, tal y como viene definido en el Glosario de términos de I.M. Energía, con lo cual, cuanto mayor sea la demanda más energías de alto coste entrarán al pool y más caro será el precio de la electricidad. La predicción de la demanda y el precio permite a los productores ajustar la producción de energía para satisfacer la demanda en todo momento de manera fiable y conocer el precio al que se va a vender para poder ajustar sus precios y de esta manera tratar de ser más competitivos y aumentar sus opciones de entrar al pool. De la misma manera, permite a los usuarios adaptar su consumo en función del precio. En este Trabajo Fin de Grado (TFG) nos centraremos en la predicción del precio horario del mercado spot disponiendo de los datos relativos al mercado eléctrico para los años 2013,2014 y 2015 desglosados por horas. Entre los datos se encuentran los relativos a precios, demanda y producción según tecnología utilizada (nuclear, hidráulica,…). Actualmente las técnicas empleadas arrojan un error de un en torno a un 3% en el mejor de los casos para la predicción del precio, pudiendo llegar a ser de hasta el 10%. Por ello, toda técnica que colabore a mejorar estos resultados supondrá un beneficio económico para la sociedad por los ahorros derivados de un mejor conocimiento del precio y el consiguiente ajuste del consumo de los usuarios. Así, se ha planteado este trabajo de fin de grado para evaluar cómo las novedosas técnicas estadísticas conocidas como algoritmos tipo árbol se comportan en este entorno y su posible aplicación al mercado eléctrico español. En este TFG se ha evaluado el comportamiento de los algoritmos de tipo árbol en la predicción del precio de la electricidad en el mercado eléctrico español. Principalmente se quería observar la adecuación de los Árboles Dinámicos (Dynamic Trees) y compararla con otros estudios de la misma índole realizados para los Random Forests. Ambos tipos de técnicas están basadas en árboles de decisión, herramienta no paramétrica que funciona realizando cortes recursivos del espacio de observaciones según una variable explicativa de la variable respuesta. Los Random Forests son como la palabra indica un bosque o conjunto de árboles de decisión creados a partir de un mismo conjunto de datos mediante dos criterios de aleatoriedad. Sus objetivos pueden ser la explicación o la predicción de una variable respuesta. Los Dynamic Trees o Árboles dinámicos, algo más modernos, incorporan la inferencia bayesiana a los árboles de decisión para la creación de los árboles, apoyándose así en probabilidades y elementos de los que se dispone a priori. La parte de mayor innovación de este TFG ha sido el modelado de los Dynamic Trees aplicándolo al mercado eléctrico español, los cuales al ser muy recientes todavía no se habían aplicado a este ámbito de estudio. La electricidad es un recurso básico del que toda la sociedad se nutre y la definición de su precio es un factor de gran interés a todos los niveles de la sociedad. Es por ello que se ha estudiado si esta novedosa técnica de análisis y predicción es capaz de comportarse de una manera adecuada en este ámbito de estudio consiguiendo igualar o mejorar las técnicas actualmente usadas basadas en series temporales. Para ello se han realizado los siguientes experimentos y modelos: Primeramente se han evaluado las técnicas y sus parámetros para posteriormente poder modelar los árboles y que de esta manera se consiguiesen las mejores predicciones posibles. Por otro lado, pese a tener una amplia base de datos, se intuía que no era necesario hacer uso de todos ellos para obtener buenas y fiables predicciones a corto plazo. Así, se han realizado experimentos en los que se evaluaba el horizonte temporal necesario para predecir el precio de las 72 horas posteriores al último dato del que se disponía. Además, se han realizado tres escenarios distintos para tratar de explicar si el precio de la electricidad en una franja horaria depende de una manera más acusada del precio de la misma hora en el día anterior o por el contrario tiene más que ver con el obtenido en esa hora para el mismo día de la semana previa a la analizada. Así, además del modelo general se han evaluado los modelos con datos únicamente referentes a fines de semana y a días laborables por separado. Por último, se ha evaluado la posible mejora en las predicciones obtenidas al usar como variables predictoras los precios ya obtenidos mediante este sistema además de la base de datos usada para calcular estos últimos. Para poder evaluar los resultados se han elegido el MAPE (Mean Absolute Percentage Error o Error Porcentual Absoluto Medio) y el MSE (Mean Squared Error o Error Cuadrático Medio) como medidas de error cometido al predecir, primando el MAPE por su mayor interpretabilidad. Tras realizar numerosos tests con el objetivo de determinar qué parámetros tienen influencia positiva en las predicciones, las conclusiones han sido las siguientes: -Aumentar el número de observaciones en general conduce a unas mejores predicciones. -Para los árboles, en Random Forests, a partir de una profundidad de doce no se produce una mejora significativa y por el contrario el consumo de recursos aumenta de manera exponencial. -Las variables más significativas para las tres técnicas siempre son los precios en las horas anteriores que facilitan enormemente la predicción dado que el precio no varía bruscamente. También se destaca en casi todas ellas el ciclo combinado, usado cuando el resto de centrales no es capaz de cubrir la demanda entrando así el último al pool y causando los precios altos, y la hora, determinante para la demanda y consecuentemente el precio. Además en los Random Forests siempre aparece como significativa la producción de energía mediante régimen especial que es la que engloba a las renovables y la que causa los precios bajos. En cuanto a las hipótesis de que no eran necesarios todos los datos para predecir a corto plazo con resultados los suficientemente buenos y fiables, se han confirmado las intuiciones obteniendo que en este ejemplo la longitud de la muestra de entrenamiento del modelo para predecir el precio de 72 horas es: -3 meses para Random Forest-CART -3 meses para Random Forest -CI -6 meses para Dynamic Trees Esto conlleva que se obtienen predicciones fiables con un menor consumo de memoria y un menor tiempo de computación sin apenas pérdida en la capacidad predictiva. En cuanto a las predicciones: -El método más rápido es el Random Forest -CART. -Tiene sentido obviar los datos de los fines de semana para predecir el precio de los días laborables, conduciendo a una mejora de las predicciones. -Introducir las predicciones que se van extrayendo como variables predictoras para obtener las siguientes tan sólo parece tener sentido para los Random Forests, obteniendo peores resultados para los Dynamic Trees. A modo de conclusión general, los modelos tipo árbol y en concreto los Árboles Dinámicos que eran los que no se habían utilizado hasta ahora han demostrado tener un comportamiento más que satisfactorio aplicándolos al mercado eléctrico español. Así, los Dynamic Trees concretamente y los modelos tipo árbol en general se postulan como una herramienta de gran potencial e interés para su aplicación al mercado de la electricidad en España así como a problemas de diversa índole que requieran un tratamiento de datos complejo y de gran volumen, facilitando su análisis, interpretabilidad y extracción de conclusiones.

Más información

ID de Registro: 45533
Identificador DC: http://oa.upm.es/45533/
Identificador OAI: oai:oa.upm.es:45533
Depositado por: Biblioteca ETSI Industriales
Depositado el: 21 Abr 2017 06:50
Ultima Modificación: 21 Abr 2017 06:50
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • e-ciencia
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM