Citation
Gaspar Peral, Pablo
(2015).
Elaboración y evaluación de modelos predictivos de negocio.
Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.
Abstract
-Este trabajo de fin de grado es un estudio de un caso real de predicción sobre grandes cantidades de datos. Se ha llevado a cabo a partir de los datos recogidos en un sitio web de competiciones de data mining y se han elaborado dos modelos predictivos mediante diferentes técnicas de modelización para tratar de predecir si un hecho ocurre o no ocurre. Este trabajo, sin dejar de lado el desarrollo del problema, se centra en cómo se evalúa un modelo predictivo. Por ello, se ha construido una escala propia de clasificación de modelos en función a su poder de predicción y se ha realizado un esfuerzo por definir formalmente las medidas de validación de modelos que se iban a utilizar. Cada problema concreto de datos supone un contexto diferente. Por tanto, todo el trabajo aquí desarrollado debe interpretarse en el contexto planteado y ante otros datos diferentes, no se debe tomar como verdad absoluta lo que en este documento se plantea. Este trabajo nace en un entorno empresarial de alto nivel y trata de ser un apoyo en el campo de data analytics, que hoy en día se encuentra en plena expansión.--ABSTRACT---This final bachelor work is a study of a real case of prediction over huge amounts of da- ta. This work has been done using datasets that were downloaded from a website about data mining competitions and two predictive models have been developed using different modeling techniques to try to predict if something occurs or not. This work, without leaving apart the develop of the problem, has an important component related to the evaluation of predictive models. Thus, an own scale has been built in order to classify predictive models regarding to its predictive power and it has made an effort to formaly define the validation measures that were going to be used. Each data science problem entail a different context. Therefore, this work must be interpre- ted in the context raised and with different datasets, the things written in this document, should not be taken as an absolute truth. This work grows in a high-level business environment and tries to be helpful in the data analytics field, that is rising nowadays.