Integración de Data Mining sobre noticias para predicción en mercados financieros

Hernández Fernández, Gonzalo (2020). Integración de Data Mining sobre noticias para predicción en mercados financieros. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.

Description

Title: Integración de Data Mining sobre noticias para predicción en mercados financieros
Author/s:
  • Hernández Fernández, Gonzalo
Contributor/s:
  • Menasalvas Ruiz, Ernestina
Item Type: Final Project
Degree: Grado en Ingeniería Informática
Date: February 2020
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Lenguajes y Sistemas Informáticos e Ingeniería del Software
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) | Preview

Abstract

Comprender las relaciones mutuas entre los flujos de información y la actividad social en la sociedad actual es una de las piedras angulares de las ciencias sociales. En economía financiera, el tema clave a este respecto es comprender y cuantificar cómo las noticias de todos los tipos posibles (geopolíticas, ambientales, sociales, financieras, económicas, etc.) afectan el comercio y la fijación de precios de las empresas en los mercados bursátiles. Con la introducción de la minería de textos, se han realizado estudios para analizar temas y tendencias significativos en colecciones de documentos. El análisis de tendencias utilizando la asignación de Dirichlet latente (LDA) en la minería de texto se adopta como uno de los métodos de análisis de tendencias con más alta precisión. En este trabajo, analizaremos el método de análisis LDA. El método se compone de 5 pasos y el análisis de tendencias se realiza por “tema” utilizando el resultado extraído que combina LDA y las X palabras clave principales. Al aplicar LDA y los modelos de predicción a los documentos de noticias, realizamos un modelado de temas que nos permite observar las tendencias relevantes en la Bolsa, en un período de tiempo del pasado o presente. Mostraremos que todo el panorama de noticias que afecta a los movimientos de la Bolsa se puede resumir a través de regresiones entre la actividad comercial y las piezas de información de noticias descompuestas, con la ayuda de estas 3 técnicas simples de modelado de temas. Con estos métodos, podemos estimar y cuantificar los impactos de las noticias en el comercio.---ABSTRACT---Understanding the mutual relationship between information flows and social activity in today's society is one of the cornerstones of the social sciences. In financial economics, the key issue in this regard is understanding and quantifying how news of all possible types (geopolitical, environmental, social, financial, economic, etc.) affects the trade and the pricing of companies in the stock market. With the introduction of text mining, studies have been conducted to analyze specific themes and trends in different documents collections. Trend analysis using Latent Dirichlet Allocation (LDA) in text mining is adopted as one of trend analysis methods with the highest precision. In this thesis, we will analyze the LDA analysis method. This method consists of 5 steps and trend analysis is performed by "topic" using the extracted result combining LDA and the most relevant keywords. By applying our method and LDA to news articles, we perform topic modeling and we check for relevant trends in a past or in a present time period. We will show how the entire news scene affecting the stock market movements could be summarized through regressions between the trading activity and the pieces on information thanks to these simple topic modeling techniques, according to their theme. By using these methods, we will be able to estimate and quantify the news impact on the market.

More information

Item ID: 63073
DC Identifier: http://oa.upm.es/63073/
OAI Identifier: oai:oa.upm.es:63073
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 19 Jul 2020 10:32
Last Modified: 19 Jul 2020 10:32
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM