Clasificación inferida mediante datos departamento del director del TFG

Muñoz Ramos, Miguel (2025). Clasificación inferida mediante datos departamento del director del TFG. Trabajo Fin de Grado / Proyecto Fin de Carrera, E.T.S. de Ingenieros Informáticos (UPM), Boadilla del Monte.

Descripción

Título: Clasificación inferida mediante datos departamento del director del TFG
Autor/es:
  • Muñoz Ramos, Miguel
Director/es:
Tipo de Documento: Trabajo Fin de Grado o Proyecto Fin de Carrera
Grado: Grado en Ingeniería Informática
Fecha: Junio 2025
Materias:
ODS:
Palabras Clave Informales: Minería de datos, Minería de textos, Clustering, Análisis estadístico, Data mining, Text mining, Statistical analysis
Escuela: E.T.S. de Ingenieros Informáticos (UPM)
Departamento: Inteligencia Artificial
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[thumbnail of TFG_MIGUEL_MUNOZ_RAMOS.pdf] PDF (Portable Document Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (857kB)

Resumen

Se realiza un análisis estadístico, exploración de los datos e información disponible en el Archivo Digital de la UPM, y un modelo de clasificación centrado en la variable Departamento del director de los trabajos de fin de grado. Se realizará una descripción de la estructura del AD-UPM, las variables que modelizan el título y el resumen. Se tomará una muestra de un periodo de al menos dos años y diversas Escuelas, Departamentos, etc. Realizaremos un análisis exploratorio para generar hipótesis y proponer algunas técnicas de clasificación de los trabajos de fin de grado. Se trata de desarrollar una metodología para extraer conocimiento del AD-UPM y diseñar una propuesta de análisis de los datos: Adquisición de datos, modelización, inferencia y síntesis de conclusiones. Documentar las variables y establecer los objetivos para la propuesta de análisis. Planificar el proceso de preparación de los datos, construcción y evaluación del modelo. Se debe definir las estructuras de datos para representar la información de interés que podemos extraer del AD-UPM y de los trabajos de fin de grado en particular. Completamos una muestra significativa con el fin de aprender un modelo probabilístico. Mostramos una descriptiva de los datos, generando una estructura de grupos de documentos para facilitar el aprendizaje de un clasificador. Finalmente estudiamos el rendimiento (sensibilidad, especificidad,....) del modelo de clasificación.

ABSTRACT

A statistical analysis is carried out, exploring the data and information available in the Digital Archive of the UPM, and a classification model focused on the variable Department of the director of the final degree theses. A description will be made of the structure of the AD-UPM, the variables that model the title and the abstract. A sample will be taken from a period of at least two years and various Schools, Departments, etc. We will carry out an exploratory analysis to generate hypotheses and propose some classification techniques for final degree theses. The aim is to develop a methodology to extract knowledge from the AD-UPM and to design a proposal for data analysis: Data acquisition, modelling, inference and synthesis of conclusions. Document the variables and set the objectives for the analysis proposal. Plan the process of data preparation, model building and evaluation. Data structures must be defined to represent the information of interest that we can extract from the AD-UPM and from the final degree projects in particular. We complete a significant sample in order to learn a probabilistic model. We show a descriptive summary of the data, generate a structure of groups of documents to facilitate the learning of a classifier. Finally, we study the performance (sensitivity, specificity,....) of the classification model.

Más información

ID de Registro: 90222
Identificador DC: https://oa.upm.es/90222/
Identificador OAI: oai:oa.upm.es:90222
Depositado por: Biblioteca Facultad de Informatica
Depositado el: 27 Jul 2025 08:00
Ultima Modificación: 27 Jul 2025 08:00