Citation
Durante Beleña, Juan Carlos
(2021).
Aplicación de algoritmos Boosting a la predicción de precios de energía eléctrica.
Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. Industriales (UPM), Grado en Ingeniería en Tecnologías Industriales.
Abstract
El trabajo se adentra en el mundo del Machine Learning, también conocido como “aprendizaje automático”. Machine Learning es una disciplina del campo de la inteligencia artificial que, a través de algoritmos, dota a los ordenadores de la capacidad de identificar patrones en datos masivos para hacer predicciones. En este proyecto, se trata de combinar dos campos distintos. El primero de ellos es el mercado eléctrico de España donde encontramos el precio de la energía eléctrica entre muchas otras variables y el segundo de ellos es el ya comentado mundo del Machine Learning y esta combinación se realiza mediante la predicción del precio de la energía eléctrica. Dentro del mundo de Machine Learning tenemos numerosos y variados algoritmos que se desarrollan de distintas maneras, los más famosos son Random Forest, redes neuronales, análisis cluster o boosting. Concretamente el que se aplicará en este proyecto es el boosting. Al ser un ámbito tan extenso tenemos algoritmos muy parecidos como por ejemplo son el algoritmo bagging y el algoritmo boosting pero no son iguales ya que en el boosting se actúa de forma secuencial a diferencia del bagging. Boosting está clasificado dentro del grupo de algoritmos de aprendizaje supervisado. El aprendizaje supervisado es aquel que tiene como objetivo crear una función capaz de predecir el valor correspondiente a cualquier objeto de entrada válida después de haber observado una serie de ejemplos que son llamados datos de entrenamiento. El algoritmo boosting intenta conseguir un clasificador fuerte a partir de muchos clasificadores débiles comúnmente son conocidos como weak learners o base learners. Cada uno de esos clasificadores débiles son modelos de distintos tipos: modelos de regresión lineal simple, modelos de regresión lineal múltiple o incluso, modelos binarios donde solo se trabaje con dos tipos de datos diferentes.