Clustering de sistemas de recomendación mediante técnicas de factorization matricial

Bojorque Chasi, Rodolfo Xavier (2020). Clustering de sistemas de recomendación mediante técnicas de factorization matricial. Thesis (Doctoral), E.T.S.I. de Sistemas Informáticos (UPM). https://doi.org/10.20868/UPM.thesis.58156.

Description

Title: Clustering de sistemas de recomendación mediante técnicas de factorization matricial
Author/s:
  • Bojorque Chasi, Rodolfo Xavier
Contributor/s:
  • Bobadilla Sancho, Jesus
  • Ortega Requena, Fernando
Item Type: Thesis (Doctoral)
Date: February 2020
Subjects:
Faculty: E.T.S.I. de Sistemas Informáticos (UPM)
Department: Sistemas Informáticos
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) | Preview

Abstract

La expansión de los sistemas de recomendación a nivel comercial e industrial ha permitido una rápida evolución de técnicas, métodos y algoritmos. Inicialmente las investigaciones se enfocaban en mejorar la calidad de las predicciones; sin embargo, existen desafíos importantes en cuanto a la generación de modelos que permitan el trabajo con los grandes volúmenes de información que actualmente se genera a todos los niveles. La dispersión de los conjuntos de datos es un desafío actual de los sistemas de recomendación. Aplicar técnicas como clustering y explicación de las recomendaciones son problemas de investigación actuales en el área de sistemas de recomendación. Los sistemas de recomendación basados en modelos proveen resultados más precisos, más escalables y abordan de mejor manera el problema de la dispersión. El modelo más adoptado por los sistemas de recomendación modernos es la Factorization Matricial y las técnicas derivadas de este enfoque. Esta tesis expone un estudio exhaustivo de trabajos de investigación del estado del arte y propone el uso de un método de Factorization Matricial no Negativo Bayesiano (BNMF) para mejorar los resultados de clustering de los trabajos más recientes y representativos en el área de filtrado colaborativo. También propone un innovador algoritmo de pre-clustering adaptado al método probabilístico propuesto. Los resultados obtenidos sobre varios conjuntos de datos abiertos demuestran: 1) Mejoras importantes en la calidad de clustering cuando se utiliza BNMF, en comparación con la técnica de Factorization Matricial Clásica y con técnicas mejoradas y recientes del algoritmo k-means, 2) Una mejora en la calidad de las predicciones cuando se utiliza técnicas de clustering basadas en factorization matricial, en comparación con los estudios recientes de k-means, y 3) Mejores tiempos de ejecución de BNMF en comparación con los tiempos de ejecución de la factorization matricial clásica, y una mejora adicional cuando se utiliza el algoritmo de pre-clustering propuesto. ----------ABSTRACT---------- The expansionof recommender systemstothe commercial and industrial level has allowedarapid evolutionoftechniques, methods and algorithms. Initially, research focused on improving the qualityofpredictions, however, there are significant challenges such as generating models able to work with large volumesof information. Data sparsity ondatasets isachallenge for recommender systems. Clustering and explanationofrecommendations are growing research fieldsinthe recommender systems area. Model-based recommender systems provide more accurate predictions and recommendations, more scalable results and they better address the problemofsparsity. The most adopted modelbythe modern recommender systemsisthe Matrix Factorization and their derived techniques. This thesis exposesacomprehensive studyofthe state-of-the-art research works and it proposesaBayesian non-negative matrix factorization methodtoimprove the current clustering resultsinthe collaborative filtering area.Wealso provideaninnovative pre-clustering algorithm adaptedtothe proposed probabilistic method. Results obtained using several open datasets show:1)Aconclusive clustering quality improvement when BNMFisused, compared tothe classical Matrix Factorization ortothe improved k-means results,2) A higher predictions accuracy using Matrix Factorization based methods than using improved KMeans, and3)Better BNMF execution times comparedtothoseofthe classic matrix factorization, andanadditional improvement when using the proposed pre-clustering algorithm.

More information

Item ID: 58156
DC Identifier: http://oa.upm.es/58156/
OAI Identifier: oai:oa.upm.es:58156
DOI: 10.20868/UPM.thesis.58156
Deposited by: Archivo Digital UPM 2
Deposited on: 02 Mar 2020 07:20
Last Modified: 03 Sep 2020 22:30
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM