Análisis de datos para predecir el desempeño bursátil de una empresa

Hernández Sánchez, Juan (2022). Análisis de datos para predecir el desempeño bursátil de una empresa. Trabajo Fin de Grado / Proyecto Fin de Carrera, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.

Descripción

Título: Análisis de datos para predecir el desempeño bursátil de una empresa
Autor/es:
  • Hernández Sánchez, Juan
Director/es:
Tipo de Documento: Trabajo Fin de Grado o Proyecto Fin de Carrera
Grado: Grado en Matemáticas e Informática
Fecha: Junio 2022
Materias:
ODS:
Escuela: E.T.S. de Ingenieros Informáticos (UPM)
Departamento: Lenguajes y Sistemas Informáticos e Ingeniería del Software
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[thumbnail of TFG_JUAN_HERNANDEZ_SANCHEZ.pdf] PDF (Portable Document Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (3MB)

Resumen

Existen actualmente tres categorías generales de inversión en bolsa: el análisis técnico, el análisis de sentimientos y el análisis fundamental. Las dos primeras categorías se enfocan en la predicción a corto plazo del precio de las acciones, lo cual explica el gran interés existente en ambos campos. La tercera categoría, el análisis fundamental, es la metodología preferida por los mejores inversores del mundo, aunque es menos atractiva, pues promete retornos después de décadas, no de días. A pesar de ser la metodología usada por inversores de la talla de Warren Buffett, el análisis fundamental es una corriente minoritaria y poco estudiada por la literatura académica. Por este motivo, esta metodología de inversión carece de un enfoque objetivo y sistemático que respalde las máximas de la disciplina. La mayoría de los estudios existentes que utilizan el aprendizaje automático y la minería de datos se centran en la creación de modelos de predicción basados en el análisis técnico y el análisis de sentimientos. Sin embargo, la desconexión de estos métodos con los negocios subyacentes y la falta de métodos de valoración de empresas puede afectar negativamente a sus conclusiones y a la efectividad de los modelos propuestos. En este proyecto, se pretende recolectar, preparar y estudiar datos sobre el mercado de valores en los últimos 40 años; ofreciendo fundamentos objetivos desde la perspectiva del análisis fundamental. El objetivo principal de este estudio es extraer conclusiones respaldadas por los hechos que permitan mejorar los rendimientos de los inversores particulares. Posterior al estudio, se utilizarán los datos financieros de más de 2000 empresas, cada una con décadas de información; para el desarrollo de un modelo de aprendizaje automático que permita predecir el precio de las acciones en el medio y largo plazo, para así poder generar carteras de inversión que logren batir al mercado. Durante el proyecto se proponen varios modelos de regresión usando XGBoost, que unidos a una cuidadosa selección de los datos fundamentales más importantes, son capaces de predecir sistemáticamente el precio medio de las acciones el año siguiente. Los modelos no solo muestran resultados positivos utilizando las habituales métricas de regresión. Se ha elaborado un sistema de backtesting que permite simular la construcción de carteras de inversión basadas en las recomendaciones de los modelos en años anteriores. Esto permite utilizar el rendimiento de las carteras construidas como otra métrica de evaluación. Durante la etapa estudiada todos los modelos propuestos fueron capaces de batir al índice de referencia, generando rentabilidades muy superiores al mercado y al universo de acciones estudiado.---ABSTRACT---There are currently three general categories of stock market investing: technical analysis, sentiment analysis, and fundamental analysis. The first two categories focus on short-term stock price forecasting, which explains the great interest in both fields. The third category, fundamental analysis, is the methodology preferred by the best investors in the world, although it is less attractive, since it promises returns after decades, not days. Despite being the methodology used by investors of the stature of Warren Buffett, fundamental analysis is a minority trend and little studied in academic literature. For this reason, this investment methodology lacks an objective and systematic approach that supports the maxims of the discipline. Most of the existing studies using machine learning and data mining focus on building prediction models based on technical analysis and sentiment analysis. However, the disconnection of these methods with the underlying businesses and the lack of company valuation methods may negatively affect their conclusions and the effectiveness of the proposed models. In this project, it is intended to collect, prepare, and study data on the stock market in the last 40 years; offering objective foundations from a fundamental analysis perspective. The main objective of this study is to draw conclusions supported by the facts that allow improving the returns of individual investors. After the study, the financial data of more than 2000 companies will be used, each with decades of information; for the development of an automatic learning model that allows predicting the price of shares in the medium and long term, to generate investment portfolios that manage to beat the market. During the project, several regression models are proposed using XGBoost, which, together with a careful selection of the most important fundamental data, are capable of systematically predicting the average share price for the following year. The models don't just show positive results using the usual regression metrics. A backtesting system has been developed that allows simulating the construction of investment portfolios based on recommendation models in previous years. This allows the performance of the constructed portfolios to be used as another evaluation metric. During the studied stage, all the proposed models were able to beat the reference index, generating returns well above the market and the universe of shares studied.

Más información

ID de Registro: 70928
Identificador DC: https://oa.upm.es/70928/
Identificador OAI: oai:oa.upm.es:70928
Depositado por: Biblioteca Facultad de Informatica
Depositado el: 05 Jul 2022 07:26
Ultima Modificación: 05 Jul 2022 07:26