Generación automática de reglas de categorización de texto en un método híbrido basado en aprendizaje

Lana Serrano, Sara; Villena Román, Julio; Collada Pérez, Sonia y González Cristóbal, José Carlos (2011). Generación automática de reglas de categorización de texto en un método híbrido basado en aprendizaje. "Procesamiento de Lenguaje Natural" (n. 47); pp. 231-237. ISSN 1135-5948.

Descripción

Título: Generación automática de reglas de categorización de texto en un método híbrido basado en aprendizaje
Autor/es:
  • Lana Serrano, Sara
  • Villena Román, Julio
  • Collada Pérez, Sonia
  • González Cristóbal, José Carlos
Tipo de Documento: Artículo
Título de Revista/Publicación: Procesamiento de Lenguaje Natural
Fecha: 2011
Materias:
Palabras Clave Informales: Clasificación de texto, aprendizaje computacional, sistema basado en reglas, kNN, Reuters-21578, información mutua, generación automática de reglas, evaluación.
Escuela: E.U.I.T. Telecomunicación (UPM) [antigua denominación]
Departamento: Ingeniería y Arquitecturas Telemáticas [hasta 2014]
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (560kB) | Vista Previa

Resumen

En este artículo se evalúan diferentes técnicas para la generación automática de reglas que se emplean en un método híbrido de categorización automática de texto. Este método combina un algoritmo de aprendizaje computacional con diferentes sistemas basados en reglas en cascada empleados para el filtrado y reordenación de los resultados proporcionados por dicho modelo base. Aquí se describe una implementación realizada mediante el algoritmo kNN y un lenguaje básico de reglas basado en listas de términos que aparecen en el texto a clasificar. Para la evaluación se utiliza el corpus de noticias Reuters-21578. Los resultados demuestran que los métodos de generación de reglas propuestos producen resultados muy próximos a los obtenidos con la aplicación de reglas generadas manualmente y que el sistema híbrido propuesto obtiene una precisión y cobertura comparables a la de los mejores métodos del estado del arte.

Más información

ID de Registro: 12322
Identificador DC: http://oa.upm.es/12322/
Identificador OAI: oai:oa.upm.es:12322
URL Oficial: http://sinai.ujaen.es/sepln/ojs/ojs/index.php/pln/article/view/980
Depositado por: Memoria Investigacion
Depositado el: 28 Ago 2012 08:37
Ultima Modificación: 21 Abr 2016 11:34
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • e-ciencia
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM