Deep Learning para sistemas de recomendación basado en contenido

Pérez Sastre, Diego (2018). Deep Learning para sistemas de recomendación basado en contenido. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. de Sistemas Informáticos (UPM), Madrid.

Description

Title: Deep Learning para sistemas de recomendación basado en contenido
Author/s:
  • Pérez Sastre, Diego
Contributor/s:
  • Serradilla García, Francisco
Item Type: Final Project
Degree: Grado en Ingeniería de Computadores
Date: 2018
Subjects:
Freetext Keywords: Inteligencia artificial Redes neuronales
Faculty: E.T.S.I. de Sistemas Informáticos (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) | Preview

Abstract

Este proyecto de fin de grado propone una alternativa basada en Deep Learning a los sistemas de recomendación más clasistas, es decir, aquellos que basan sus predicciones en un sistema de filtrado colaborativo. En particular, se propone la investigación del uso de técnicas de procesamiento de lenguaje natural y redes neuronales profundas para intentar resolver las siguientes preguntas de investigación: ¿Es posible recomendar una película a un usuario basándose en la sinopsis y en los géneros?; ¿Existe relación entre la sinopsis de una película y la nota que un usuario le pueda dar?. Concretamente, el problema en el que se va a investigar es el que plantea las preguntas de investigación. Se intentará aproximar una solución a un sistema de recomendación basado en contenido, donde el contenido serán los géneros de la película o serie y su descripción del guion o sinopsis. En particular, con esta solución se pretende demostrar que sí es posible recomendar un contenido multimedia basado en su descripción y en su género, pero no solo eso, sino también que, si el resultado es positivo, además de demostrar que la solución puede llegar a rendir mejor que las aproximaciones por filtrado colaborativo, paliaríamos el problema del arranque en frío, es decir, el tiempo que tarda un sistema clásico en empezar a recomendar un contenido nuevo en su base de datos debido a la poca popularidad del mismo entre los usuarios. En este proyecto se proponen dos aproximaciones distintas superficialmente, pero con la misma base, la primera será el uso de una arquitectura de red neuronal codificador descodificador tanto para el tratamiento de los géneros como para el tratamiento de la sinopsis, concatenando así los resultados de estas redes en una nueva red neuronal profunda que trate de predecir la nota del contenido multimedia concreto. La segunda aproximación será similar, pero cambiando la manera de tratar la descripción del contenido multimedia de codificador descodificador a palabras embebidas, donde cada palabra se convertirá en un vector que define su semántica. De esta segunda aproximación se hará una variante donde el problema pasará a ser de clasificación, y en lugar de predecir la nota solamente se estimará un “recomendado” o “no recomendado”. Para finalizar la solución al problema se plantea una transferencia de aprendizaje de la red general para cada usuario especifico, de este modo con un entrenamiento menor el usuario tendrá un sistema de recomendación basado en contenido personificado. Este documento se estructurará en seis capítulos distintos más uno de referencias. Siendo así el primer capítulo una introducción a la problemática, al tema concreto y a la motivación personal en este proyecto. Seguido por dos capítulos teóricos, uno con la base teórica necesaria para seguir todo lo que se va a tratar a lo largo del trabajo y otro en el que se hablará del estado del arte de todas las técnicas y tecnologías de las que versa el proyecto. A continuación, tendremos dos capítulos prácticos, en el primero se presentará el diseño de los modelos de aprendizaje y en el segundo se presentarán los experimentos y los resultados obtenidos. Acabando así con un ultimo capitulo en el que se sacarán las conclusiones del proyecto y se hablará de posible trabajo futuro en esta línea. Abstract: This final degree project proposes an alternative based on Deep Learning to more classist recommendation systems, that is, those that base their predictions on a collaborative filtering system. In particular, it is proposed to research the use of natural language processing techniques and deep neural networks to try to solve the following research questions: Is it possible to recommend a film to a user based on the synopsis and the genres? Is there a relationship between the synopsis of the movie and the qualification that a user can give? Specifically, the problem in which it is going to investigate is the one posed by the research questions, an attempt will be made to approximate a solution to a recommendation system based on content, where the content will be the genres of the film or series and its description of the script or synopsis. Especially, this solution aims to demonstrate that it is possible to recommend a multimedia content based on its description and its genre, but not only that, but also that, if the result is positive, in addition to demonstrating that the solution can reach to perform better than the approaches by collaborative filtering, we would alleviate the problem of cold start, that is, the time it takes for a classic system to start recommending new content in its database due to its low popularity among users. In this project, two different approaches are proposed superficially, but with the same base, the first will be the use of a decoding network architecture for the neural network, both for the treatment of the genres and for the treatment of the synopsis, thus concatenating the results of these networks in a new deep neural network that tries to predict the qualification of the specific multimedia content. The second approach will be similar but changing the way of treating the description of the multimedia content from decoder encoder to embedded words, where each word will become a vector that defines its semantics. From this second approach a variant will be made where the problem will become a classification, and instead of predicting the grade, only a "recommended" or "not recommended" will be estimated. To finalize the solution to the problem a transfer of learning of the general network for each specific user is proposed, in this way with a minor training the user will have a recommendation system based on personified content. This document will be structured in six different chapters plus one of references. Thus, the first chapter is an introduction to the problem, to the specific topic and to the personal motivation in this project. Followed by two theoretical chapters, one with the theoretical basis necessary to follow everything that is going to be discussed throughout the work and another in which the state of the art of all the techniques and technologies that the project deals with will be discussed. Next, we will have two practical chapters, in the first it will present the design of the learning models and in the second it will present the experiments and the results obtained. Finishing this way with a final chapter in which the conclusions of the project will be drawn, and future work will be discussed in this line.

More information

Item ID: 52053
DC Identifier: http://oa.upm.es/52053/
OAI Identifier: oai:oa.upm.es:52053
Deposited by: Biblioteca Universitaria Campus Sur
Deposited on: 06 Sep 2018 06:07
Last Modified: 06 Sep 2018 06:07
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM