Towards reliability in collaborative filtering recommender systems

Zhu, Bo (2018). Towards reliability in collaborative filtering recommender systems. Thesis (Doctoral), E.T.S.I. de Sistemas Informáticos (UPM). https://doi.org/10.20868/UPM.thesis.54719.

Description

Title: Towards reliability in collaborative filtering recommender systems
Author/s:
  • Zhu, Bo
Contributor/s:
  • Bobadilla Sancho, Jesus
Item Type: Thesis (Doctoral)
Date: September 2018
Subjects:
Faculty: E.T.S.I. de Sistemas Informáticos (UPM)
Department: Sistemas Informáticos
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (5MB) | Preview

Abstract

Los sistemas de recomendación han tenido un rápido crecimiento tanto en investigación académica como en aplicaciones industriales en los últimos años. Las recomendaciones se nos proporcionan cuando elegimos elementos como música, películas, restaurantes, noticias, etc. Como parte de las técnicas de recomendación más prometedoras, los sistemas basados en recomendación de filtros colaborativos desempeñan un papel importante en las aplicaciones actuales. La aparición de nuevas fuentes de información requiere la combinación de sistemas de recomendación con técnicas avanzadas de otros campos, como el análisis de redes sociales, el procesamiento del lenguaje natural, el aprendizaje en profundidad, etc. Esta combinación mejora la calidad de las recomendaciones. Los sistemas de recomendación anteriores se centran principalmente en las mejoras de la precisión de la recomendación. Recientemente, surge una tendencia para la evaluación del rendimiento de los sistemas de recomendación que toma muchas propiedades nuevas en consideración. La fiabilidad es uno de los aspectos más notables y será profundamente estudiado en esta tesis. Se han propuesto algunas medidas para medir la fiabilidad de los sistemas de recomendación de filtrado colaborativo basados en la memoria. Sin embargo, observamos un área sin cubrir en el diseño de las medidas de fiabilidad adecuadas para los sistemas de recomendación de filtros colaborativos basados en modelos, especialmente aquellos basados en la factorización matricial. También encontramos que hay una falta de medidas de calidad de fiabilidad adecuadas. Esta tesis se concentra en proporcionar soluciones a ambas ausencias. Después de un estudio exhaustivo de trabajos de investigación del estado del arte, proponemos una nueva medida de fiabilidad que supera los desafíos de generalización y abstracción causados por los factores latentes de los métodos de factorización matricial. La medida propuesta se compara con con métodos y algoritmos representativos, usando bases de datos publicas, tanto académicas como comerciales. Los resultados experimentales muestran que nuestra nueva medida logra mejoras en la calidad de la recomendación. Además, la medida de fiabilidad propuesta también tiene un impacto muy positivo contra los "Shilling Attacks". Para obtener una mejora respecto a las medidas existentes de calidad de la fiabilidad, también proponemos, hasta donde sabemos, la primera medida de calidad de fiabilidad universal que es capaz de proporcionar valores numéricos para cualquier tipo de sistema de recomendación. Esta medida también se ha probado usando conjuntos de datos públicos reales y ha sido comparada con los métodos de calidad de la fiabilidad existentes. Basándonos en los resultados de los experimentos, concluimos que nuestra medida supera los últimos trabajos de investigación, proporcionando valores de calidad de fiabilidad más precisos e informativos. ----------ABSTRACT---------- Recommender systems have experienced a rapid growth in both academical research and industrial applications in latest years. Recommendations are provided to us when we choose items such as music, movies, restaurants, news, etc. As the most promising recommendation techniques, collaborative filtering recommender systems play an important role in current applications. The emergence of novel information sources requires to combine recommender systems with several advanced techniques coming from other fields like social network analysis, natural language processing, deep learning etc. This combination improves the quality of recommendations. Previous recommender systems research mainly focuses on the improvements of recommendation accuracy. Recently a new trend arises for the performance evaluation of recommender systems that takes many novel properties into consideration. Reliability is one of the most remarkable aspects, which will be deeply studied in this thesis. Some measures have been proposed for measuring reliability of memory based collaborative filtering recommender systems. However, we observe a gap in the design of proper reliability measures for model based collaborative filtering recommender systems, especially those based on matrix factorization. We also found that there is a lack in proper reliability quality measures. This thesis concentrates on providing solutions to both lacks. After a comprehensive study of state-of-the-art research works, we propose a novel reliability measure that overcomes the challenges of generality and abstraction caused by latent factors of matrix factorization methods. The proposed measure is tested against current baselines on public academic and commercial datasets; experiment results show that our novel measure achieves better improvements on recommendation quality. What’s more, the proposed reliability measure also has a very positive impact against shilling attacks. In order to fill in the blank of reliability quality measures, we also propose, as far as we know, the first universal reliability quality measure that is able to provide numerical values for any type of recommender systems. This measure has also been tested on public academic and commercial datasets using current methods. Based on the experiment results we conclude that our quality measure outperforms state-of-the-art research works by providing more accurate and informative reliability quality values.

More information

Item ID: 54719
DC Identifier: http://oa.upm.es/54719/
OAI Identifier: oai:oa.upm.es:54719
DOI: 10.20868/UPM.thesis.54719
Deposited by: Archivo Digital UPM 2
Deposited on: 23 Apr 2019 08:50
Last Modified: 22 Oct 2019 22:30
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM