Predicción del precio de la energía eléctrica utilizando herramientas de minería de datos. Comparación entre países de la eurozona, incluyendo el efecto de la temperatura para el estudio de los Spikes.

Armenteros Iniesta, Iván (2017). Predicción del precio de la energía eléctrica utilizando herramientas de minería de datos. Comparación entre países de la eurozona, incluyendo el efecto de la temperatura para el estudio de los Spikes.. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. Industriales (UPM).

Descripción

Título: Predicción del precio de la energía eléctrica utilizando herramientas de minería de datos. Comparación entre países de la eurozona, incluyendo el efecto de la temperatura para el estudio de los Spikes.
Autor/es:
  • Armenteros Iniesta, Iván
Director/es:
  • Morales Alonso, Gustavo
  • González Fernández, María Camino
Tipo de Documento: Proyecto Fin de Carrera/Grado
Grado: Grado en Ingeniería en Tecnologías Industriales
Fecha: Febrero 2017
Materias:
Escuela: E.T.S.I. Industriales (UPM)
Departamento: Ingeniería de Organización, Administración de Empresas y Estadística
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (6MB) | Vista Previa

Resumen

Este proyecto nace con el objetivo de crear un sistema de predicción de precios eléctricos capaz de identificar los picos que se dan, tanto altos como bajos, gracias al empleo de la temperatura como indicador. El motivo por el cual se plantea, recae en la cantidad de momentos durante el año en los cuales una meteorología excepcional para su época, como puede ser una ola de calor o un temporal de frío, produce un aumento o reducción de los precios eléctricos. Para ello, se cree necesario no sólo construir un sistema capaz de identificar dichas situaciones y predecir los precios, sino también conocer los motivos por los cuáles se dan. Por lo tanto, los objetivos del proyecto son la creación del sistema de predicción de precios eléctricos y la extracción de información sobre el comportamiento de los mismos para entender de qué factores dependen y en qué medida. La predicción es una actividad que goza de gran importancia en este sector, debido a la planificación que precisa a la hora de realizar cualquiera de sus actividades. Por ello, es un tema de análisis muy actual, en el que hay un gran número de interesados y en el que cualquier información o conocimiento previo de los precios o de su comportamiento, hará posible una toma de decisiones acertada. Entre todos los factores de los que dependen los precios eléctricos, la temperatura es, sin duda, el más importante dentro de la meteorología. Por ello, se emplea como variable explicativa de los precios, y ayuda a la identificación de los picos altos y bajos en función de sus valores, lo cual es ciertamente novedoso en estudios de este estilo. Además, la meteorología y su influencia en los precios es muy distinta de unos países a otros, debido a las características que posee cada mercado eléctrico. Por ello, la realización de una comparación entre distintos países europeos genera una mejor identificación de los verdaderos motivos por los que se dan los picos en los precios, y de cuáles son los factores que mayor influencia tienen. Por otra parte, dicha comparación ayuda a destacar las diferencias y similitudes entre los principales mercados eléctricos europeos, como son: el Mercado Ibérico, Nord Pool, GME Italia y Epex Spot. Ahora bien, los precios que se necesitan para la creación del sistema de predicción, son aquellos que fluctúen en mayor medida debido a factores externos. Por ello, se emplean como datos los precios eléctricos horarios a corto plazo. Se consiguen dichos precios y las temperaturas medias desde Enero de 2013 a Abril de 2016, de un total de quince países europeos: España, Italia, Francia, Portugal, Alemania, Austria, Suiza, Gran Bretaña, Dinamarca, Suecia, Lituania, Estonia, Letonia, Noruega, y Finlandia. De esta manera, se obtiene un volumen enorme de datos. Con los datos obtenidos, se decide realizar la predicción de los meses de Julio de 2015, Noviembre de 2015, Febrero de 2016 y Abril de 2016. La elección de estos meses no es al azar, sino que se eligen por ser representativos de cada época del año e históricamente denominados como los meses más difíciles de predecir del año. Por lo tanto, para la realización del sistema de predicción es necesario emplear herramientas que sean capaces de gestionar grandes volúmenes de datos y que aporten la mayor información posible sobre su comportamiento, además de una gran capacidad predictiva. Por ese motivo, se decide emplear técnicas de Minería de Datos. De entre todas las posibles técnicas de Minería de Datos, se seleccionan los Modelos de Árboles, ya que aportan información de tipo gráfico, cuantitativo y cualitativo sobre el comportamiento de los datos de una manera rápida y sencilla. Además, tienen la posibilidad de aplicar distintos modelos sobre los mismos datos, de esta forma se consigue describir de manera amplia el establecimiento de precios eléctricos a corto plazo y los motivos por los cuales se dan picos en ellos. Por ese motivo, en este proyecto se aplican cuatro modelos distintos de árboles: CART, Conditional Inference Trees, Bagging y Random Forest. Cada uno de ellos aporta distintas características y contrarresta los errores y fallos que tienen los demás, cerrando el círculo de posibilidades para que la información extraída de los datos sea total y completa, y así asegurar un alto nivel de predicciones. De esta manera, se consigue entender no sólo el funcionamiento de los algoritmos que emplean, sino cuáles son los más y menos idóneos a aplicar en un estudio de este calibre. Para su creación, se emplea la herramienta RStudio, la cual aporta multitud de posibilidades y ofrece alta comodidad en la gestión de grandes volúmenes de datos, como es el caso de este proyecto. A través de sus librerías, se aplican sencillos comandos que ponen en marcha el algoritmo correspondiente, creando los modelos de árboles sobre el comportamiento de los datos de manera rápida, como el modelo de Conditional Inference Trees que se crea para predecir Julio de 2015 en Italia. Una vez los modelos son creados a través de todas las técnicas, se estudian sus características para ajustarlos y adaptarlos a lo que se busca de ellos: capacidad predictiva y descriptiva. Para ello, se analizan sus parámetros de creación, viendo la variación del error de predicción que generan. Con los modelos ajustados, primero se aplican distintos comandos para entender las similitudes y diferencias entre mercados, describir las relaciones entre las variables involucradas (histórico de precios eléctricos y temperaturas medias) y así conocer el orden de importancia que tienen sobre la determinación del precio en cada país. Tras esto, se realizaron las predicciones a través de las cuatro técnicas. Los resultados obtenidos indican lo siguiente: -En el mercado ibérico, España y Portugal poseen la misma configuración de precios, donde las principales variables que determinan el precio son la hora y el precio en la hora anterior. En cuanto al efecto de la temperatura, ésta es la siguiente variable relevante que afecta a la determinación del precio. Por último, hay que destacar que las mejores predicciones se consiguen a través de Bagging. -En el mercado nórdico: Noruega, Dinamarca, Suecia y Finlandia poseen una extensa red de conexiones eléctricas de alta capacidad, que hace que sus precios sean tremendamente parecidos y que el sistema arroje precios muy bajos gracias al gran uso de energías renovables que hacen. Las principales variables que determinan el precio son el precio en la hora anterior y el precio dos horas antes, donde no existe casi efecto de la temperatura. Por último, hay que destacar que las mejores predicciones se consiguen, a través de Random Forest. -En los países bálticos: Lituania, Letonia y Estonia, las principales variables que determinan el precio son el precio en la hora anterior y el precio del día anterior, donde el efecto de la temperatura es relevante, pero en cuarto lugar. Los valores de las predicciones en los cuatro modelos son similares, debido a que también poseen una red de altas conexiones entre ellos, donde las mejores predicciones se consiguen, de nuevo, a través de Random Forest, con una buena identificación de picos de precios altos y bajos. -En los países centroeuropeos: Francia, Austria, Alemania, Italia y Suiza, las principales variables que determinan el precio son la hora y el precio en la hora anterior, donde la temperatura no tiene prácticamente efecto. De nuevo, las mejores predicciones se realizan con Random Forest, con la identificación de picos de precios altos y bajos. -Por último, Gran Bretaña, donde las principales variables que determinan el precio son el precio del día antes y el precio en la hora anterior, y no existe efecto de la temperatura. Random Forest es, de nuevo, la técnica que realiza las mejores predicciones con gran identificación de picos en los precios, los cuales se sitúan, en la mayoría de los casos, entre las 19 y las 20 horas. Para ver la calidad de las predicciones realizadas en cada mes, éstas se comparan con los precios reales a corto plazo, calculando el error cometido a través del MAPE o media absoluta del porcentaje de error. Lo primero que se observa con los resultados, es que Febrero es el mes más difícil de predecir, debido a que es un mes muy influenciado por la meteorología, la cual es muy inestable y cambiante de unos días a otros, y muy distinta de unos años a otros. Esto provoca que sus precios sean muy distintos de unos años a otros y que, por tanto, la predicción, que se basa en el comportamiento del histórico de precios con la influencia de la temperatura, no se ajuste de igual manera a la realidad en este mes en comparación con los demás. Aun así, los resultados que arroja tanto Febrero como el resto de meses, son bastante buenos, debido en gran parte a que el horizonte temporal es bastante corto (se usan los datos de los 13 meses anteriores al de predicción), lo cual facilita en gran medida realizar buenas predicciones. En cuanto al resto de meses, los resultados son aproximadamente similares entre ellos, sin grandes diferencias ni valores excesivamente altos con respecto a los demás, aunque se puede ver que Julio y Noviembre suelen ser meses más fáciles de predecir debido a sus características meteorológicas más estables. Por otro lado, se obtienen también los errores medios de predicción cometidos para los distintos países del estudio. Dichos errores definen varios países como los más difíciles de predecir, concretamente: España, Portugal y, sobretodo, Dinamarca. Donde el aumento de los errores es producido porque el sistema de predicción no es capaz de identificar los picos bajos de precios, arrojando un error muy alto en dichas situaciones. Esos momentos de picos de precios bajos se estudian y se descubre que son provocados por grandes volúmenes de generación eléctrica mediante fuentes renovables, los cuales son excepcionales y provocan unos precios tan bajos que el sistema no los identifica y hacen que el error aumente mucho. Aun así, el sistema de predicción posee errores muy bajos e identifica los picos de precios altos con gran precisión, aunque los picos de precios bajos no los realice con la misma soltura. Esto demuestra que el sistema funciona y es capaz de realizar buenas predicciones, pero a la vez, que puede ser mejorado a través de la introducción de nuevas variables en el estudio: como son la generación eléctrica horaria total y la generación eléctrica horaria mediante fuentes renovables. Gracias a estas nuevas variables el sistema será capaz de identificar de mejor manera los picos en los precios, en función de la relación entre ambas. Gracias a este estudio, se consigue entender los motivos por los que se crean picos de precios altos y bajos, y por qué son tan difíciles de predecir. Además, se logra describir las diferencias existentes entre el comportamiento de los precios en unos países y en otros, y la gran influencia que tiene el empleo de energías renovables. Aun así, este proyecto debe ser considerado como un punto de partida, el cual implementar y mejorar hacia la creación de modelos evolucionados más flexibles y robustos, que permitan saber al máximo el comportamiento de los precios y de los mercados eléctricos. Así se conseguirá conocer con antelación cualquier situación y poder tomar las medidas que reduzcan su impacto en la sociedad y en el medioambiente.

Más información

ID de Registro: 46025
Identificador DC: http://oa.upm.es/46025/
Identificador OAI: oai:oa.upm.es:46025
Depositado por: Biblioteca ETSI Industriales
Depositado el: 24 May 2017 05:24
Ultima Modificación: 24 May 2017 05:24
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • e-ciencia
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM