Recomendaciones basadas en contenido por medio de campos semánticos implícitos

Rubio Pérez-Castejón, Gaia (2020). Recomendaciones basadas en contenido por medio de campos semánticos implícitos. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. de Sistemas Informáticos (UPM), Madrid.

Description

Title: Recomendaciones basadas en contenido por medio de campos semánticos implícitos
Author/s:
  • Rubio Pérez-Castejón, Gaia
Contributor/s:
  • Gallardo Pérez, Carolina
Item Type: Final Project
Degree: Grado en Ingeniería del Software
Date: June 2020
Subjects:
Freetext Keywords: Sistemas de recomendación
Faculty: E.T.S.I. de Sistemas Informáticos (UPM)
Department: Sistemas Informáticos
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img] PDF - Users in campus UPM only - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB)
[img] Archive (ZIP) - Users in campus UPM only
Download (13MB)

Abstract

El trabajo de fin de grado presentado se enmarca en el ámbito de sistemas de filtrado de información y más concretamente en los sistemas de recomendación. El objetivo ha sido crear un sistema recomendador basado en contenido usando técnicas de procesamiento de lenguaje natural, específicamente de vectorización de texto, para realizar recomendaciones a partir de la cercanía semántica de los ítems, indexándolos automáticamente en la base de datos en el momento de inserción realizando cambios sobre sus conjuntos de palabras clave o etiquetas en función de la cercanía a las ya presentes en los ítems previos. Con este objetivo se ha realizado un estado del arte sobre sistemas recomendadores, repasando las técnicas más actualizadas y caracterizando los distintos tipos presentes en el mercado. Se ha hecho también un recorrido similar por técnicas recientes de procesamiento de lenguaje natural, haciendo especial énfasis sobre la vectorización de texto. A continuación se ha mostrado la documentación seguida para el desarrollo del código fuente, destacando las tecnologías en uso y documentación a alto nivel del sistema para comprender correctamente su funcionamiento. Con el código desarrollado se ha procedido a realizar pruebas usando conjuntos de datos diseñados para sistemas de extracción de información, obteniendo unas conclusiones provisionales sobre el rendimiento y precisión del desarrollo. Finalmente se han propuesto líneas de investigación y mejoras abiertas para el futuro del sistema. Abstract: This final degree project is included within the field of information filtering, more specifically in the recommender systems domain. The purpose throughout has been to develop a content-based recommender system using natural language processing techniques, text vectorization methods in particular, to provide recommendations based on the semantic closeness of the items, automatically indexing them in the database by making changes to their keyword or tag sets in accordance to the closeness to the already present in previous items. For this purpose, a state of the art on recommender systems was carried out, reviewing the most up-to-date techniques and characterizing the available systems present in the market. A similar approach has been taken regarding natural language processing, especially on text vectorization. After that, documentation followed during the development of the source code has been presented, highlighting the used technologies and high-level documentation to properly understand its behaviour. Experimentation has followed the development of the system, using datasets designed for information retrieval system to draw provisional conclusions on the performance and precision of the code. Finally, future research and improvements have been proposed for the developed system.

More information

Item ID: 64087
DC Identifier: http://oa.upm.es/64087/
OAI Identifier: oai:oa.upm.es:64087
Deposited by: Biblioteca Universitaria Campus Sur
Deposited on: 25 Sep 2020 08:42
Last Modified: 25 Sep 2020 08:42
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM