Generación de artículos en español

Contreras Martín, Raúl (2020). Generación de artículos en español. Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).

Description

Title: Generación de artículos en español
Author/s:
  • Contreras Martín, Raúl
Contributor/s:
  • Boguslavskiy Margolin, Igor
Item Type: Thesis (Master thesis)
Masters title: Inteligencia Artificial
Date: June 2020
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Inteligencia Artificial
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (3MB) | Preview

Abstract

Los artículos son un tipo de palabras que está muy presente en la lengua española. Cumplen varias funciones, muestran si la información ofrecida por el sustantivo era ya conocida o no, concuerdan en género y número con el nombre al que acompañan y pueden dar la función de sustantivo a algunas expresiones que no la poseen y que carecen de un sustantivo. En problemas de traducción automática nos encontramos con la tesitura de que este tipo de palabras no están presentes en algunos idiomas, como es el caso del chino, o, por otro lado, que no funcionan exactamente igual que en español, como pasa con el inglés; que cumplen algunas reglas pero otras no, como por ejemplo el artículo the, que es el único artículo definido y no requiere concordancia en género y número con los sustantivos a los que acompaña. Por ello, cuando se traduce automáticamente una frase de un idioma a otro podemos encontrarnos una ausencia de artículos o un funcionamiento distinto, y ahí es donde se centra este trabajo. En respuesta a este problema, he desarrollado una aplicación que puede detectar dónde deberían ir los artículos necesarios y los introduce de forma que la frase sea correcta gramatical y semánticamente en castellano. Así, se hará uso de definiciones lingüísticas en español para el desarrollo de unas reglas que servirán de apoyo a unos modelos de deep learning, con resultados del estado del arte, para obtener la mayor precisión y eficiencia.---ABSTRACT---Articles are a very prominent type of word in Spanish. They fulfill a varied number of functions; they show if the information offered by the noun was already known or not, they agree with the noun that they accompany in gender and number, and they can give noun properties to phrases without a noun. Looking at automatic translation, we face the problem that these types of words do not exist in every language, as is the case in Chinese. On the other hand, there are articles that don’t work in the same way in other languages as they do in Spanish, such as in English, in which they follow some but not all of the rules. For example, the article the is the only definite article; it does not agree with the noun in gender nor in number. Therefore, when a phrase is translated automatically, it may be the case that in Spanish the article is used in a different way or not used altogether. These discrepancies in the article use is what the thesis is focused on. To answer this problem, I have developed an application which detects whether an article should be inserted or not. It subsequently inserts the article if necessary, in order to obtain a grammatically and semantically correct phrase in Spanish. To carry this out, I have made use of Spanish linguistic definitions, in order to develop rules that support the state-of-the-art deep learning models, with the aim of obtaining the greatest possible accuracy and efficiency.

More information

Item ID: 63688
DC Identifier: http://oa.upm.es/63688/
OAI Identifier: oai:oa.upm.es:63688
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 09 Sep 2020 11:12
Last Modified: 09 Sep 2020 11:12
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM