DocuSmart: Plataforma web para el análisis automático de documentos mediante el procesamiento del lenguaje natural

Sánchez López, Miguel Ángel (2025). DocuSmart: Plataforma web para el análisis automático de documentos mediante el procesamiento del lenguaje natural. Trabajo Fin de Grado / Proyecto Fin de Carrera, E.T.S.I. de Sistemas Informáticos (UPM), Madrid.

Descripción

Título: DocuSmart: Plataforma web para el análisis automático de documentos mediante el procesamiento del lenguaje natural
Autor/es:
  • Sánchez López, Miguel Ángel
Director/es:
Tipo de Documento: Trabajo Fin de Grado o Proyecto Fin de Carrera
Grado: Grado en Ingeniería del Software
Fecha: Julio 2025
Materias:
ODS:
Palabras Clave Informales: Aplicación web; Procesamiento del Lenguaje Natural; Inteligencia artificial; Python; Django; Bootstrap; Docentes; Accesibilidad educativa; Análisis de documentos
Escuela: E.T.S.I. de Sistemas Informáticos (UPM)
Departamento: Sistemas Informáticos
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[thumbnail of TFG_MIGUEL_ANGEL_SANCHEZ_LOPEZ.pdf] PDF (Portable Document Format) - Acceso permitido solamente a usuarios en el campus de la UPM - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (2MB)

Resumen

Este Trabajo Fin de Grado presenta el diseño y desarrollo de DocuSmart, una herramienta web orientada a docentes que permite analizar documentos de forma automatizada mediante técnicas de inteligencia artificial. Su objetivo principal es facilitar tareas educativas como la elaboración de temarios, la creación de exámenes y la corrección de trabajos, promoviendo una enseñanza más eficiente, personalizada y accesible.

La herramienta ha sido implementada en Python utilizando el framework Django, con integración en la nube mediante Azure Storage, y una interfaz web desarrollada en Bootstrap. Permite al usuario subir documentos para su análisis automático, incorporando funcionalidades como generación de preguntas de desarrollo, análisis de sentimiento, evaluación de la comprensión lectora (Flesch Reading Ease), cohesión textual, estadísticas léxicas, generación de nubes de palabras, la generación de enlaces a partir de las palabras clave del texto, traducción multilingüe, simplificación de textos y accesibilidad mediante lectura en voz alta, aumento de fuente y uso de emoticonos, pensando especialmente en personas con discapacidad visual o con TEA.

La metodología aplicada ha seguido un enfoque de desarrollo incremental, incluyendo módulos de autenticación de usuarios, gestión documental, integración de APIs externas y lógica propia para el procesamiento del lenguaje natural. Los resultados obtenidos demuestran la viabilidad técnica del sistema, así como su utilidad en contextos educativos reales y diversos.

Se concluye que DocuSmart constituye una base sólida para su ampliación futura, tanto a nivel funcional como de despliegue en la nube. Asimismo, el proyecto se alinea con el ODS 4: Educación de calidad, contribuyendo a modernizar los procesos de enseñanza-aprendizaje mediante el uso de tecnologías inteligentes, inclusivas y adaptadas al profesorado.

Abstract:

This Bachelor’s Thesis presents the design and development of DocuSmart, a webbased tool aimed at teachers that enables the automated analysis of educational documents using artificial intelligence techniques. Its main objective is to assist educators with tasks such as preparing teaching materials, creating exams, and grading assignments, thereby promoting more efficient, personalized, and accessible education.

The tool was developed in Python using the Django framework, integrated with Azure Storage, and features a user-friendly interface built with Bootstrap. Users can upload documents for automated analysis with functionalities such as question open-ended generation, sentiment analysis, reading comprehension evaluation (Flesch Reading Ease), text cohesion assessment, lexical statistics, word cloud generation, generation of relevant links based on the keywords extracted from the analyzed text, multilingual translation, text simplification, and accessibility features like text-to-speech, font enlargement, and emoticon support—especially designed for users with visual impairments or ASD.

The methodology followed an incremental development approach, incorporating user authentication, document management, external API integration, and custom natural language processing logic. The results confirm the technical feasibility of the system and its practical application in real educational contexts.

It is concluded that DocuSmart provides a solid foundation for future extensions in functionality and cloud deployment. Moreover, this project is aligned with SDG 4: Quality Education, contributing to the modernization of teaching and learning processes through intelligent, inclusive, and educator-oriented technologies.

Más información

ID de Registro: 90331
Identificador DC: https://oa.upm.es/90331/
Identificador OAI: oai:oa.upm.es:90331
Depositado por: Biblioteca Universitaria Campus Sur
Depositado el: 30 Jul 2025 19:22
Ultima Modificación: 30 Jul 2025 19:22