Predicción de precios de criptomonedas con random forest

Carrión Pérez, Rafael (2020). Predicción de precios de criptomonedas con random forest. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. Industriales (UPM).

Description

Title: Predicción de precios de criptomonedas con random forest
Author/s:
  • Carrión Pérez, Rafael
Contributor/s:
  • Mira McWilliams, José Manuel
  • Sánchez Naranjo, María Jesús
Item Type: Final Project
Degree: Grado en Ingeniería en Tecnologías Industriales
Date: June 2020
Subjects:
Freetext Keywords: Trading, Inteligencia artificial, Machine Learning, Random Forest, RMSE, MAE, MAPE, R2, OBB.
Faculty: E.T.S.I. Industriales (UPM)
Department: Ingeniería de Organización, Administración de Empresas y Estadística
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (7MB) | Preview

Abstract

La utilización de criptomonedas como forma de pago cada día es más habitual. A pesar de que muchos acontecimientos indican que han sido y se siguen utilizando en el mercado negro, la aceptación por parte de empresas e inversores para la realización de transacciones es alta. De hecho, el 80% de las empresas así lo suscriben. No obstante, la volatilidad presente en estas monedas virtuales ha frenado la expansión de esta forma de pago debido al escepticismo generado por su sistema descentralizado y sin autoridades controladoras. [1] Es frecuente la utilización de las criptomonedas como una forma de Trading, como en los mercados de valores. Al igual que sucede en la bolsa, el Trading permite especular con el precio de las criptomonedas, generando órdenes de compra y venta de activos. El auge de las criptomonedas ha llevado a muchos inversores al intensivo intento de la predicción del precio de las criptomonedas con el claro objetivo de aumentar sus beneficios. El mercado de las criptomonedas tiene como una de sus principales desventajas la alta volatilidad de sus precios, por el riesgo que supone. Es por ello por lo que se propone hacer un estudio exhaustivo de las mismas. La descentralización presente en las criptomonedas está relacionada con esa fluctuación de precios en ocasiones, ya que grandes inversores pueden invertir en un activo mediante grandes movimientos de capital sin que haya ninguna explicación posible o correlación observable sobre su situación real, afectando de forma directa a los precios de las criptomonedas en el mercado. Es por ello por lo que se persiguen e investigan formas de predecir subidas y bajadas del precio de las criptomonedas. La inteligencia artificial (IA) ha supuesto un espectacular impacto tecnológico en numerosos ámbitos de la sociedad como la educación, la medicina, las finanzas, la ingeniería o la seguridad y defensa. Se trata de una forma de computación y de transformación de la información. Aunque para la mayoría de la gente este avance pasa desapercibido en su día a día, hay muchas funciones impulsadas por la IA en nuestros dispositivos móviles. Tan rápidos son los avances que nadie puede imaginar qué avances revolucionarios habrá en unos años. El aprendizaje automático o Machine Learning es una rama de la IA que se basa en el aprendizaje de las computadoras con la mínima interacción humana. A su vez, existe otra rama dentro del Machine Learning, el aprendizaje supervisado, el cual se centra en que las máquinas aprendan por sí mismas a través del entrenamiento y dados unos datos de entrada se obtienen unos datos de salida. En el presente Trabajo de Fin de Grado se aplican técnicas de aprendizaje supervisado con el objetivo de hacer predicciones de los valores de las criptomonedas, tratando de reducir la alta volatilidad a la que se ve expuesto el mercado. En concreto, se hará un estudio de las 7 criptomonedas con mayor capitalización de mercado mediante de la utilización de la técnica de Random Forest o Bosques Aleatorios. Las criptomonedas que se han propuesto son Bitcoin, Ethereum, Ripple, Litecoin, Dash, Cardano y EOS. La ventaja que supone hacer predicciones y anticiparnos a los movimientos del mercado es de gran interés por los beneficios económicos que puede conllevar. Los inversores pueden tener una gran ayuda de cara a la toma de decisiones al disponer de esta herramienta. Con la técnica planteada se pretende la creación de modelos predictivos del precio de cierre a partir de unas características seleccionadas. Una vez realizada la predicción se evaluarán los resultados obtenidos en el conjunto de validación. El procedimiento que se ha seguido para realizar este estudio consta de tres etapas claramente diferenciadas. En primer lugar, se ha analizado el interés que tiene el presente proyecto y se ha realizado una investigación para adquirir los conocimientos necesarios. No sólo se ha indagado en la técnica de Random Forest, si no que se ha buscado y reflexionado sobre el origen y la evolución de las criptomonedas. En segundo lugar, se han obtenido datos históricos y se han construido modelos de predicción utilizando para ello con Random Forest que predecirán los precios de cierre del conjunto de prueba. Se realizará una comparación entre los modelos propuestos en función de la cantidad de información obtenida de cada criptomoneda. Es decir, se obtendrán precios cada cuatro, dos y media hora. Para comprobar la eficacia de cada modelo propuesto se crearán un conjunto de entrenamiento y otro de prueba, siendo este último de menor tamaño. De esta forma, el 80% más antiguos de los datos serán los datos de entrenamiento y el 20% restante más reciente corresponderá a los datos de prueba. La evaluación de cada modelo se realizará en un conjunto de validación mediante la raíz del error cuadrático medio (RMSE), el error absoluto medio (MAE), el error porcentual absoluto medio (MAPE) y el coeficiente de determinación (R2) así como el error fuera de la bolsa o comúnmente llamado OOB error. Cuando se aplica el algoritmo de RF y se selecciona una muestra con reemplazo algunas observaciones se quedan “fuera de la muestra” (Out of Bag) y no se utilizan para la creación de los árboles. Para esas observaciones fuera de la muestra, se obtiene el error de la predicción, el llamado OOB error. Al realizar una predicción de las muestras OOB se ha de tener en cuenta que se ha realizado un shuffle al obtener los datos y se ha considerado un 1% perteneciente a la validación, obteniéndose de forma desordenada (aleatoria) los datos de entrada. El conjunto de prueba será muy pequeño en comparación con el conjunto de entrenamiento, asegurando que los datos más recientes pertenezcan al conjunto de prueba. Al haber obtenido las variables de entrada de forma aleatoria tiene lugar una interpolación temporal. En tercer y último lugar, se han analizado los resultados y se ha concluido con qué criptomonedas se han predicho de forma más precisa. Se ha realizado una comparación en cuanto a resultados, analizando también qué modelo es el escogido finalmente en cada criptomoneda, cuánto peso tiene cada variable de entrada de cada criptomoneda para instantes anteriores a la predicción, qué archivos temporales conducen a mejores resultados y qué criptomonedas han logrado en mayor medida alcanzar el objetivo.

More information

Item ID: 62842
DC Identifier: http://oa.upm.es/62842/
OAI Identifier: oai:oa.upm.es:62842
Deposited by: Biblioteca ETSI Industriales
Deposited on: 23 Sep 2020 05:43
Last Modified: 30 Sep 2020 22:30
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM