Transformar un texto en una representación gráfica

Rodríguez Álvarez, Rubén (2023). Transformar un texto en una representación gráfica. Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).

Description

Title: Transformar un texto en una representación gráfica
Author/s:
  • Rodríguez Álvarez, Rubén
Contributor/s:
Item Type: Thesis (Master thesis)
Masters title: Ciencia de Datos
Date: July 2023
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[thumbnail of TFM_RUBEN_RODRIGUEZ_ALVAREZ.pdf] PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB)

Abstract

En este Trabajo Fin de Máster se busca mejorar la comprensión y accesibilidad cognitiva de la información para personas con dificultades en la lectura. El objetivo es desarrollar un método basado en Procesamiento de Lenguaje Natural (PLN) que permita extraer y visualizar información relevante en forma de grafo, permitiendo la lectura fácil.

Se realiza una revisión de la literatura para analizar herramientas y técnicas de PLN relacionadas con el enfoque propuesto. Entre las técnicas de PLN evaluadas, se utiliza la librería spaCy y el modelo "es_dep_news_trf" para el procesamiento del lenguaje. La tokenización es la técnica principal aplicada, obteniendo resultados satisfactorios en el análisis sintáctico, morfológico y extracción de relaciones.

Se comparan diferentes librerías y herramientas para mejorar la tokenización y se proponen nuevas técnicas, como el uso de datos enlazados, resumen automático y extracción de temas. Además, se proponen modificaciones al grafo para facilitar la lectura, como la reducción y ampliación de la complejidad, así como la incorporación de imágenes y pictogramas.

El trabajo plantea el desafío de integrar técnicas de PLN y visualizaciones gráficas de manera coherente, descartando propuestas que no cumplan con esta integración. Debido a la falta de recursos y herramientas de PLN en español en comparación con el inglés, se analizan diversas técnicas disponibles para mejorar los resultados. Este trabajo abre nuevas oportunidades para futuras investigaciones en el campo de la accesibilidad cognitiva y la lectura fácil, promoviendo la inclusión de personas con dificultades en la lectura.

ABSTRACT

The aim of this Master's thesis is to improve the comprehension and cognitive accessibility of information for people that have reading difficulties. The objective is to develop a method based on Natural Language Processing (NLP) to extract and visualise relevant information in the form of a graph, facilitating easy reading.

A literature review is carried out to analyse NLP tools and techniques related to the proposed approach. Among the NLP techniques evaluated, the spaCy library and the "es_dep_news_trf" model are used for language processing. Tokenisation is the main technique applied, obtaining satisfactory results in parsing, morphological analysis and relation extraction.

Different libraries and tools to improve tokenisation are compared and new techniques are proposed, such as the use of linked data, automatic summarisation and topic extraction. In addition, modifications to the graph are proposed to make it easier to read, such as reducing and extending complexity, as well as incorporating images and pictograms.

The challenge of integrating NLP techniques and graphic visualisations in a coherent way, discarding proposals that do not comply with this integration is raised. Due to the lack of NLP resources and tools in Spanish compared to English, various techniques available to improve the results are analysed.

New opportunities for future research in the field of cognitive accessibility and easy reading, promoting the inclusion of people with reading difficulties, are open.

More information

Item ID: 75837
DC Identifier: https://oa.upm.es/75837/
OAI Identifier: oai:oa.upm.es:75837
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 13 Sep 2023 11:08
Last Modified: 13 Sep 2023 11:08
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM