Abstract
La tesis se organiza en dos partes, la primera dedicada a una revisión del estado del arte del tratamiento automático del LN y la segunda centrada en la descripción de la propuesta de este trabajo. El capítulo 2 presenta una introducción a la disciplina del tratamiento automático del LN, junto con una visión sobre la evolución del procesamiento del LN que se ha estructurado en tres generaciones, cada una de ellas arcada por un cambio de paradigma de esta disciplina. Se ha dedicado mayor atención a la tercera generación y sus tres vertientes (racionalista, empírica e híbrida), que abarca aproximadamente la última década. En esta tercera generación también se describen los trabajos más significativos en adquisición (semi) automática de esquemas de BD a partir del LN así como diversas plataformas para desarrollo de recursos y aplicaciones PLN. Finalmente, se incluye una discusión sobre la situación actual en esta disciplina que motivan la propuesta de esta memoria La segunda parte de este trabajo comienza con una justificación de la propuesta del modelo de conocimiento definido (capítulo 4) que se expone detalladamente en el capítulo 5. El capítulo 6 se dedica a los trabajos de implementación y, por último, el capítulo 7 presenta las conclusiones. También se incluyen cinco apéndices, el primero de ellos contiene un desarrollo completo de un caso de estudio correspondiente a un esquema descriptivo extraído del corpus de textos disponible, el segundo presenta todos los verbos extraídos del corpus completados con los diferentes tipos de información, el tercero incluye los textos que componen el corpus, el cuarto incluye los diagramas de control de los procesos lingüísticos, y el último un diagrama con toda la arquitectura definida.