Texto completo
Vista Previa |
PDF (Portable Document Format)
- Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (564kB) | Vista Previa |
| Título: | Elaboración y evaluación de modelos predictivos de negocio |
|---|---|
| Autor/es: |
|
| Director/es: |
|
| Tipo de Documento: | Trabajo Fin de Grado o Proyecto Fin de Carrera |
| Grado: | Grado en Matemáticas e Informática |
| Fecha: | Junio 2015 |
| Materias: | |
| ODS: | |
| Palabras Clave Informales: | Modelos predictivos; Conjuntos de datos; XGBoost; Regresión logística; Validación; Curva ROC; Lift; Predictive models; Datasets; XGBoos; Logistic regression; validation; ROC curve; Lift |
| Escuela: | E.T.S. de Ingenieros Informáticos (UPM) |
| Departamento: | Lenguajes y Sistemas Informáticos e Ingeniería del Software |
| Licencias Creative Commons: | Reconocimiento - Sin obra derivada - No comercial |
Vista Previa |
PDF (Portable Document Format)
- Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (564kB) | Vista Previa |
-Este trabajo de fin de grado es un estudio de un caso real de predicción sobre grandes cantidades de datos. Se ha llevado a cabo a partir de los datos recogidos en un sitio web de competiciones de data mining y se han elaborado dos modelos predictivos mediante diferentes técnicas de modelización para tratar de predecir si un hecho ocurre o no ocurre. Este trabajo, sin dejar de lado el desarrollo del problema, se centra en cómo se evalúa un modelo predictivo. Por ello, se ha construido una escala propia de clasificación de modelos en función a su poder de predicción y se ha realizado un esfuerzo por definir formalmente las medidas de validación de modelos que se iban a utilizar. Cada problema concreto de datos supone un contexto diferente. Por tanto, todo el trabajo aquí desarrollado debe interpretarse en el contexto planteado y ante otros datos diferentes, no se debe tomar como verdad absoluta lo que en este documento se plantea. Este trabajo nace en un entorno empresarial de alto nivel y trata de ser un apoyo en el campo de data analytics, que hoy en día se encuentra en plena expansión.--ABSTRACT---This final bachelor work is a study of a real case of prediction over huge amounts of da- ta. This work has been done using datasets that were downloaded from a website about data mining competitions and two predictive models have been developed using different modeling techniques to try to predict if something occurs or not. This work, without leaving apart the develop of the problem, has an important component related to the evaluation of predictive models. Thus, an own scale has been built in order to classify predictive models regarding to its predictive power and it has made an effort to formaly define the validation measures that were going to be used. Each data science problem entail a different context. Therefore, this work must be interpre- ted in the context raised and with different datasets, the things written in this document, should not be taken as an absolute truth. This work grows in a high-level business environment and tries to be helpful in the data analytics field, that is rising nowadays.
| ID de Registro: | 42909 |
|---|---|
| Identificador DC: | https://oa.upm.es/42909/ |
| Identificador OAI: | oai:oa.upm.es:42909 |
| Depositado por: | Biblioteca Facultad de Informatica |
| Depositado el: | 19 Jul 2016 07:07 |
| Ultima Modificación: | 27 Oct 2016 10:36 |
Publicar en el Archivo Digital desde el Portal Científico