Elaboración y evaluación de modelos predictivos de negocio

Gaspar Peral, Pablo (2015). Elaboración y evaluación de modelos predictivos de negocio. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.

Descripción

Título: Elaboración y evaluación de modelos predictivos de negocio
Autor/es:
  • Gaspar Peral, Pablo
Director/es:
  • Medinilla Martínez, Nelson
Tipo de Documento: Proyecto Fin de Carrera/Grado
Grado: Grado en Matemáticas e Informática
Fecha: Junio 2015
Materias:
Palabras Clave Informales: Modelos predictivos; Conjuntos de datos; XGBoost; Regresión logística; Validación; Curva ROC; Lift; Predictive models; Datasets; XGBoos; Logistic regression; validation; ROC curve; Lift
Escuela: E.T.S. de Ingenieros Informáticos (UPM)
Departamento: Lenguajes y Sistemas Informáticos e Ingeniería del Software
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (564kB) | Vista Previa

Resumen

-Este trabajo de fin de grado es un estudio de un caso real de predicción sobre grandes cantidades de datos. Se ha llevado a cabo a partir de los datos recogidos en un sitio web de competiciones de data mining y se han elaborado dos modelos predictivos mediante diferentes técnicas de modelización para tratar de predecir si un hecho ocurre o no ocurre. Este trabajo, sin dejar de lado el desarrollo del problema, se centra en cómo se evalúa un modelo predictivo. Por ello, se ha construido una escala propia de clasificación de modelos en función a su poder de predicción y se ha realizado un esfuerzo por definir formalmente las medidas de validación de modelos que se iban a utilizar. Cada problema concreto de datos supone un contexto diferente. Por tanto, todo el trabajo aquí desarrollado debe interpretarse en el contexto planteado y ante otros datos diferentes, no se debe tomar como verdad absoluta lo que en este documento se plantea. Este trabajo nace en un entorno empresarial de alto nivel y trata de ser un apoyo en el campo de data analytics, que hoy en día se encuentra en plena expansión.--ABSTRACT---This final bachelor work is a study of a real case of prediction over huge amounts of da- ta. This work has been done using datasets that were downloaded from a website about data mining competitions and two predictive models have been developed using different modeling techniques to try to predict if something occurs or not. This work, without leaving apart the develop of the problem, has an important component related to the evaluation of predictive models. Thus, an own scale has been built in order to classify predictive models regarding to its predictive power and it has made an effort to formaly define the validation measures that were going to be used. Each data science problem entail a different context. Therefore, this work must be interpre- ted in the context raised and with different datasets, the things written in this document, should not be taken as an absolute truth. This work grows in a high-level business environment and tries to be helpful in the data analytics field, that is rising nowadays.

Más información

ID de Registro: 42909
Identificador DC: http://oa.upm.es/42909/
Identificador OAI: oai:oa.upm.es:42909
Depositado por: Biblioteca Facultad de Informatica
Depositado el: 19 Jul 2016 07:07
Ultima Modificación: 27 Oct 2016 10:36
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • e-ciencia
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM