eprintid: 64087 rev_number: 12 eprint_status: archive userid: 2544 dir: disk0/00/06/40/87 datestamp: 2020-09-25 08:42:44 lastmod: 2020-09-25 08:42:44 status_changed: 2020-09-25 08:42:44 type: other metadata_visibility: show creators_name: Rubio Pérez-Castejón, Gaia contributors_name: Gallardo Pérez, Carolina title: Recomendaciones basadas en contenido por medio de campos semánticos implícitos rights: by-nc-nd ispublished: unpub subjects: informatica full_text_status: restricted keywords: Sistemas de recomendación abstract: El trabajo de fin de grado presentado se enmarca en el ámbito de sistemas de filtrado de información y más concretamente en los sistemas de recomendación. El objetivo ha sido crear un sistema recomendador basado en contenido usando técnicas de procesamiento de lenguaje natural, específicamente de vectorización de texto, para realizar recomendaciones a partir de la cercanía semántica de los ítems, indexándolos automáticamente en la base de datos en el momento de inserción realizando cambios sobre sus conjuntos de palabras clave o etiquetas en función de la cercanía a las ya presentes en los ítems previos. Con este objetivo se ha realizado un estado del arte sobre sistemas recomendadores, repasando las técnicas más actualizadas y caracterizando los distintos tipos presentes en el mercado. Se ha hecho también un recorrido similar por técnicas recientes de procesamiento de lenguaje natural, haciendo especial énfasis sobre la vectorización de texto. A continuación se ha mostrado la documentación seguida para el desarrollo del código fuente, destacando las tecnologías en uso y documentación a alto nivel del sistema para comprender correctamente su funcionamiento. Con el código desarrollado se ha procedido a realizar pruebas usando conjuntos de datos diseñados para sistemas de extracción de información, obteniendo unas conclusiones provisionales sobre el rendimiento y precisión del desarrollo. Finalmente se han propuesto líneas de investigación y mejoras abiertas para el futuro del sistema. Abstract: This final degree project is included within the field of information filtering, more specifically in the recommender systems domain. The purpose throughout has been to develop a content-based recommender system using natural language processing techniques, text vectorization methods in particular, to provide recommendations based on the semantic closeness of the items, automatically indexing them in the database by making changes to their keyword or tag sets in accordance to the closeness to the already present in previous items. For this purpose, a state of the art on recommender systems was carried out, reviewing the most up-to-date techniques and characterizing the available systems present in the market. A similar approach has been taken regarding natural language processing, especially on text vectorization. After that, documentation followed during the development of the source code has been presented, highlighting the used technologies and high-level documentation to properly understand its behaviour. Experimentation has followed the development of the system, using datasets designed for information retrieval system to draw provisional conclusions on the performance and precision of the code. Finally, future research and improvements have been proposed for the developed system. date_type: completed date: 2020-06 place_of_pub: Madrid institution: ETSI_Sistemas_Infor department: Sistemas_informaticos_2014 refereed: TRUE grado: Grado en Ingeniería del Software citation: Rubio Pérez-Castejón, Gaia (2020). Recomendaciones basadas en contenido por medio de campos semánticos implícitos. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. de Sistemas Informáticos (UPM) , Madrid. document_url: http://oa.upm.es/64087/1/TFG_GAIA_RUBIO_PEREZ_CASTEJON.pdf document_url: http://oa.upm.es/64087/2/TFG_GAIA_RUBIO_PEREZ_CASTEJON_ANEXOS.zip