Full text
Preview |
PDF
- Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) | Preview |
Bojorque Chasi, Rodolfo Xavier (2020). Clustering de sistemas de recomendación mediante técnicas de factorization matricial. Thesis (Doctoral), E.T.S.I. de Sistemas Informáticos (UPM). https://doi.org/10.20868/UPM.thesis.58156.
Title: | Clustering de sistemas de recomendación mediante técnicas de factorization matricial |
---|---|
Author/s: |
|
Contributor/s: |
|
Item Type: | Thesis (Doctoral) |
Read date: | February 2020 |
Subjects: | |
Faculty: | E.T.S.I. de Sistemas Informáticos (UPM) |
Department: | Sistemas Informáticos |
Creative Commons Licenses: | Recognition - No derivative works - Non commercial |
Preview |
PDF
- Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) | Preview |
La expansión de los sistemas de recomendación a nivel comercial e industrial ha permitido una rápida evolución de técnicas, métodos y algoritmos. Inicialmente las investigaciones se enfocaban en mejorar la calidad de las predicciones; sin embargo, existen desafíos importantes en cuanto a la generación de modelos que permitan el trabajo con los grandes volúmenes de información que actualmente se genera a todos los niveles. La dispersión de los conjuntos de datos es un desafío actual de los sistemas de recomendación. Aplicar técnicas como clustering y explicación de las recomendaciones son problemas de investigación actuales en el área de sistemas de recomendación. Los sistemas de recomendación basados en modelos proveen resultados más precisos, más escalables y abordan de mejor manera el problema de la dispersión. El modelo más adoptado por los sistemas de recomendación modernos es la Factorization Matricial y las técnicas derivadas de este enfoque. Esta tesis expone un estudio exhaustivo de trabajos de investigación del estado del arte y propone el uso de un método de Factorization Matricial no Negativo Bayesiano (BNMF) para mejorar los resultados de clustering de los trabajos más recientes y representativos en el área de filtrado colaborativo. También propone un innovador algoritmo de pre-clustering adaptado al método probabilístico propuesto. Los resultados obtenidos sobre varios conjuntos de datos abiertos demuestran: 1) Mejoras importantes en la calidad de clustering cuando se utiliza BNMF, en comparación con la técnica de Factorization Matricial Clásica y con técnicas mejoradas y recientes del algoritmo k-means, 2) Una mejora en la calidad de las predicciones cuando se utiliza técnicas de clustering basadas en factorization matricial, en comparación con los estudios recientes de k-means, y 3) Mejores tiempos de ejecución de BNMF en comparación con los tiempos de ejecución de la factorization matricial clásica, y una mejora adicional cuando se utiliza el algoritmo de pre-clustering propuesto. ----------ABSTRACT---------- The expansionof recommender systemstothe commercial and industrial level has allowedarapid evolutionoftechniques, methods and algorithms. Initially, research focused on improving the qualityofpredictions, however, there are significant challenges such as generating models able to work with large volumesof information. Data sparsity ondatasets isachallenge for recommender systems. Clustering and explanationofrecommendations are growing research fieldsinthe recommender systems area. Model-based recommender systems provide more accurate predictions and recommendations, more scalable results and they better address the problemofsparsity. The most adopted modelbythe modern recommender systemsisthe Matrix Factorization and their derived techniques. This thesis exposesacomprehensive studyofthe state-of-the-art research works and it proposesaBayesian non-negative matrix factorization methodtoimprove the current clustering resultsinthe collaborative filtering area.Wealso provideaninnovative pre-clustering algorithm adaptedtothe proposed probabilistic method. Results obtained using several open datasets show:1)Aconclusive clustering quality improvement when BNMFisused, compared tothe classical Matrix Factorization ortothe improved k-means results,2) A higher predictions accuracy using Matrix Factorization based methods than using improved KMeans, and3)Better BNMF execution times comparedtothoseofthe classic matrix factorization, andanadditional improvement when using the proposed pre-clustering algorithm.
Item ID: | 58156 |
---|---|
DC Identifier: | https://oa.upm.es/58156/ |
OAI Identifier: | oai:oa.upm.es:58156 |
DOI: | 10.20868/UPM.thesis.58156 |
Deposited by: | Archivo Digital UPM 2 |
Deposited on: | 02 Mar 2020 07:20 |
Last Modified: | 03 Sep 2020 22:30 |