Tagging Spanish Texts: the Problem of ‘se’

Aguado de Cea, G.; Puche Alosete, J. y Ramos, JA. (2008). Tagging Spanish Texts: the Problem of ‘se’. En: "Language Resources and Evaluation Conference (LREC 2008)", 28-30 de mayo de 2008, Marrakech, Morocco.. ISBN 2-9517408-4-0.

Descripción

Título: Tagging Spanish Texts: the Problem of ‘se’
Autor/es:
  • Aguado de Cea, G.
  • Puche Alosete, J.
  • Ramos, JA.
Tipo de Documento: Ponencia en Congreso o Jornada (Artículo)
Título del Evento: Language Resources and Evaluation Conference (LREC 2008)
Fechas del Evento: 28-30 de mayo de 2008
Lugar del Evento: Marrakech, Morocco.
Título del Libro: Language Resources and Evaluation Conference (LREC 2008).
Fecha: 26 Mayo 2008
ISBN: 2-9517408-4-0
Materias:
Palabras Clave Informales: oeg
Escuela: Facultad de Informática (UPM) [antigua denominación]
Departamento: Inteligencia Artificial
Grupo Investigación UPM: Ontology Engineering Group – OEG
Licencias Creative Commons: Ninguna

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (145kB) | Vista Previa

Resumen

Automatic tagging in Spanish has historically faced many problems because of some specific grammatical constructions. One of these traditional pitfalls is the ‘se’ particle. This particle is a multifunctional and polysemous word used in many different contexts. Many taggers do not distinguish the possible uses of ‘se’ and thus provide poor results at this point. In tune with the philosophy of free software, we have taken a free annotation tool as a basis, we have improved and enhanced its behaviour by adding new rules at different levels and by modifying certain parts in the code to allow for its possible implementation in other EAGLES-compliant tools. In this paper, we present the analysis carried out with different annotators for selecting the tool, the results obtained in all cases as well as the improvements added and the advantages of the modified tagger.

Más información

ID de Registro: 5113
Identificador DC: http://oa.upm.es/5113/
Identificador OAI: oai:oa.upm.es:5113
Depositado por: Dr Oscar Corcho
Depositado el: 02 Dic 2010 12:52
Ultima Modificación: 20 Abr 2016 14:03
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • e-ciencia
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM