Abstract
El procesado de lenguaje natural es una de las áreas de la inteligencia artificial menos avanzadas debido a la complejidad y la diversidad de las lenguas existentes en el mundo, a pesar de que la interacción entre los humanos y las máquinas es cada vez mayor. Para que esta comunicación sea posible es necesario que los sistemas sean capaces de comprender y generar el lenguaje de forma correcta sin dar lugar a ambigüedades y, para ello, es muy importante que aprendan las reglas por las que se rige el lenguaje. En esta tesis se investigan las distintas técnicas de procesado del lenguaje natural con el fin de completar el significado de textos en español no puntuados a través de la restauración de los signos de puntuación necesarios. Se da una visión del estado actual de las reglas de puntuación en la lengua española y de las diversas aproximaciones aplicadas hasta el momento para la restauración de puntuación en textos escritos. Por otro lado, se ha implementado una solución basada en las técnicas de aprendizaje profundo estudiadas y capaz de puntuar textos escritos en español, resolviendo así posibles ambigüedades de esta lengua.---ABSTRACT---Natural language processing is one of the least advanced areas of artificial intelligence due to language complexity and diversity, in spite of the fact that interaction between humans and machines is greater and greater. To make this communication possible, it’s necessary to have sistems with the ability of understanding and generating language in a good way without provoking ambiguity. Therefore, it’s very important for these sistems to learn all language rules. In this thesis, we research different natural language processing techniques with the aim of complete the meaning of unpunctuated texts written in spanish by restoring the suitable punctuation marks. We give a view of the current state of spanish punctuation rules and the diverse approaches applied so far for restoring punctuation in written texts. On the other hand, we have implemented a solution which is based on the studied deep learning techniques and able to punctuate spanish written texts, solving possible ambiguities of this language.