Clustering de variables categóricas

Villa Pérez, Luis (2020). Clustering de variables categóricas. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.

Description

Title: Clustering de variables categóricas
Author/s:
  • Villa Pérez, Luis
Contributor/s:
  • Segovia Pérez, Francisco Javier
Item Type: Final Project
Degree: Grado en Matemáticas e Informática
Date: January 2020
Subjects:
Freetext Keywords: Clustering; Algoritmo clustering; Variables categóricas; Variables cualitativas; Minería de datos; Análisis variables categóricas; Análisis de variables cualitativas; Clustering de variables categóricas; Clustering de variables cualitativas; Clustering algorithm; Categorical variables; Qualitative variables; Data Mining; Categorical variable analysis; Qualitative variable analysis; Categorical variable clustering; Qualitative variables clustering
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Lenguajes y Sistemas Informáticos e Ingeniería del Software
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (2MB) | Preview

Abstract

Frente al aumento de la cantidad de datos disponibles y el creciente interés por su explotación, en el área de la minería de datos se produce un crecimiento en la necesidad de herramientas para extraer conocimiento de estos. Existe por lo tanto un gran interés por las herramientas y algoritmos de clustering que permitan encontrar patrones o grupos de elementos similares. El objetivo de este proyecto es desarrollar una herramienta que generar clusters de datos, formados por variables categórica, sobre las cuales, al contrario que las variables numéricas, han sido menos estudiadas. Las variables categóricas son aquellas cuyo valor está definido en base a una característica cualitativa, y las variables numéricas sin embargo están definidas en base a características cuantitativas. Se ha desarrollado un algoritmo basado en clustering jerárquico y medidas de asociación. Al aplicarlo sobre datos de compras se han obtenido patrones que muestran elementos que se suelen comprar juntos y patrones de establecimientos visitados en un centro comercial.---ABSTRACT---Upon the growing quantity of available data and interest on exploiting it, in the field of Data Mining there is a need for tools that provide knowledge from this data. Therefore, there is a great a keen interest for clustering tools and algorithms which can allow to find patterns and groups of elements. The aim of this project is to develop a new tool to generate data clusters defined by categorical variables, which in opposition to clustering of quantifiable variables it is a relatively unexplored field study. Categorical variables are those assigned to a group based on a qualitative characteristic and quantifiable variables are those assigned to a group based on a quantitative characteristic. An algorithm based hierarchical clustering and association measures has been developed. And data related to shopping has been analysed with this tool and we obtained patterns showing elements that are usually bought together and patterns of shops visited by a person in a mall.

More information

Item ID: 57968
DC Identifier: http://oa.upm.es/57968/
OAI Identifier: oai:oa.upm.es:57968
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 12 Feb 2020 11:09
Last Modified: 12 Feb 2020 11:09
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM