Inducción de los esquemas narrativos de eventos

García Fernández, Víctor (2021). Inducción de los esquemas narrativos de eventos. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.

Description

Title: Inducción de los esquemas narrativos de eventos
Author/s:
  • García Fernández, Víctor
Contributor/s:
  • Boguslavsky, Igor
Item Type: Final Project
Degree: Grado en Matemáticas e Informática
Date: June 2021
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) | Preview

Abstract

En 2008, Nathanael Chambers y Dan Jurafsky, dos profesores de Lingüística computacional de la Universidad de Stanford, publicaron un paper titulado «Unsupervised Learning of Narrative Event Chains». En dicho paper, describieron el desarrollo de un nuevo algoritmo computacional para la extracción de información de textos escritos en lenguaje natural y probaron su eficacia realizando dos pruebas de concepto. El presente trabajo consiste en la adaptación de dicho trabajo al lenguaje español y la realización de las dos pruebas de concepto. Estas pruebas se enmarcan dentro de lo que se conoce como PLN o Procesamiento de Lenguaje Natural y tienen como objetivo el desarrollo de un programa capaz de procesar textos escritos en lenguaje humano y generar un script en el que se plasman los eventos acaecidos en el texto en forma de cadena. El trabajo también incluye, claro está, el análisis de los resultados obtenidos de estos experimentos, esto es, se analiza con qué fiabilidad capturan estas cadenas la información expresada en el texto. Para la realización de este trabajo ha sido necesaria la utilización de un software de código abierto llamado Freeling. Este software se encarga del análisis morfológico y sintáctico de los textos, así como de la resolución de correferencias, tras lo cual se procede a la generación de las cadenas de eventos y su posterior análisis. La relevancia de estos experimentos consiste en la posibilidad de desarrollar un programa capaz de analizar textos humanos y extraer automáticamente la información que compone la cadena de eventos, así como la identificación del ente o personaje principal que participa en dicha cadena de sucesos, al que se denominará el «Protagonista».---ABSTRACT---In 2008, Nathanael Chambers and Dan Jurafsky, two professors of Linguistics and Computer Science at Stanford University, published a paper entitled “Unsupervised Learning of Narrative Event Chains”. In this paper, they described the development of a novel computational algorithm for information extraction from texts written in natural language, and they tested its efficiency by conducting two proofs of concept. The present work consists of the adaptation of the aforementioned work to the Spanish language and the execution of those proofs of concept. This work fits within what is known as NLP or Natural Language Processing and its goal is the development of an application able to process texts written in human language and generate a script expressing the events taking place in the text as an event chain. The work also includes the analysis of the results obtained from these tests, that is, analysing how reliably capture these chains the information expressed in the text. Carrying out this work required the usage of an open-source toolkit called Freeling. This software handles the morphological and syntactical analysis of the texts, as well as the coreference resolutions, after which the author of this work must proceed to the generation of the event chains and its subsequent analysis. The relevance of these experiments lies in the possibility to develop a program able to analyse human texts and automatically extract the information that makes up the chain event, as well as the identification of the entity or main character of this event chain, who will be called the “Protagonist”.

More information

Item ID: 68370
DC Identifier: https://oa.upm.es/68370/
OAI Identifier: oai:oa.upm.es:68370
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 03 Sep 2021 07:26
Last Modified: 03 Sep 2021 07:26
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM