Full text
![]() |
PDF
- Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) |
Rodríguez Álvarez, Rubén (2023). Transformar un texto en una representación gráfica. Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).
Title: | Transformar un texto en una representación gráfica |
---|---|
Author/s: |
|
Contributor/s: |
|
Item Type: | Thesis (Master thesis) |
Masters title: | Ciencia de Datos |
Date: | July 2023 |
Subjects: | |
Faculty: | E.T.S. de Ingenieros Informáticos (UPM) |
Department: | Inteligencia Artificial |
Creative Commons Licenses: | Recognition - No derivative works - Non commercial |
![]() |
PDF
- Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) |
En este Trabajo Fin de Máster se busca mejorar la comprensión y accesibilidad cognitiva de la información para personas con dificultades en la lectura. El objetivo es desarrollar un método basado en Procesamiento de Lenguaje Natural (PLN) que permita extraer y visualizar información relevante en forma de grafo, permitiendo la lectura fácil.
Se realiza una revisión de la literatura para analizar herramientas y técnicas de PLN relacionadas con el enfoque propuesto. Entre las técnicas de PLN evaluadas, se utiliza la librería spaCy y el modelo "es_dep_news_trf" para el procesamiento del lenguaje. La tokenización es la técnica principal aplicada, obteniendo resultados satisfactorios en el análisis sintáctico, morfológico y extracción de relaciones.
Se comparan diferentes librerías y herramientas para mejorar la tokenización y se proponen nuevas técnicas, como el uso de datos enlazados, resumen automático y extracción de temas. Además, se proponen modificaciones al grafo para facilitar la lectura, como la reducción y ampliación de la complejidad, así como la incorporación de imágenes y pictogramas.
El trabajo plantea el desafío de integrar técnicas de PLN y visualizaciones gráficas de manera coherente, descartando propuestas que no cumplan con esta integración. Debido a la falta de recursos y herramientas de PLN en español en comparación con el inglés, se analizan diversas técnicas disponibles para mejorar los resultados. Este trabajo abre nuevas oportunidades para futuras investigaciones en el campo de la accesibilidad cognitiva y la lectura fácil, promoviendo la inclusión de personas con dificultades en la lectura.
ABSTRACT
The aim of this Master's thesis is to improve the comprehension and cognitive accessibility of information for people that have reading difficulties. The objective is to develop a method based on Natural Language Processing (NLP) to extract and visualise relevant information in the form of a graph, facilitating easy reading.
A literature review is carried out to analyse NLP tools and techniques related to the proposed approach. Among the NLP techniques evaluated, the spaCy library and the "es_dep_news_trf" model are used for language processing. Tokenisation is the main technique applied, obtaining satisfactory results in parsing, morphological analysis and relation extraction.
Different libraries and tools to improve tokenisation are compared and new techniques are proposed, such as the use of linked data, automatic summarisation and topic extraction. In addition, modifications to the graph are proposed to make it easier to read, such as reducing and extending complexity, as well as incorporating images and pictograms.
The challenge of integrating NLP techniques and graphic visualisations in a coherent way, discarding proposals that do not comply with this integration is raised. Due to the lack of NLP resources and tools in Spanish compared to English, various techniques available to improve the results are analysed.
New opportunities for future research in the field of cognitive accessibility and easy reading, promoting the inclusion of people with reading difficulties, are open.
Item ID: | 75837 |
---|---|
DC Identifier: | https://oa.upm.es/75837/ |
OAI Identifier: | oai:oa.upm.es:75837 |
Deposited by: | Biblioteca Facultad de Informatica |
Deposited on: | 13 Sep 2023 11:08 |
Last Modified: | 13 Sep 2023 11:08 |