Generación automática de reglas de categorización de texto en un método híbrido basado en aprendizaje

Lana Serrano, Sara and Villena Román, Julio and Collada Pérez, Sonia and González Cristóbal, José Carlos (2011). Generación automática de reglas de categorización de texto en un método híbrido basado en aprendizaje. "Procesamiento de Lenguaje Natural" (n. 47); pp. 231-237. ISSN 1135-5948.

Description

Title: Generación automática de reglas de categorización de texto en un método híbrido basado en aprendizaje
Author/s:
  • Lana Serrano, Sara
  • Villena Román, Julio
  • Collada Pérez, Sonia
  • González Cristóbal, José Carlos
Item Type: Article
Título de Revista/Publicación: Procesamiento de Lenguaje Natural
Date: 2011
ISSN: 1135-5948
Subjects:
Freetext Keywords: Clasificación de texto, aprendizaje computacional, sistema basado en reglas, kNN, Reuters-21578, información mutua, generación automática de reglas, evaluación.
Faculty: E.U.I.T. Telecomunicación (UPM)
Department: Ingeniería y Arquitecturas Telemáticas [hasta 2014]
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (560kB) | Preview

Abstract

En este artículo se evalúan diferentes técnicas para la generación automática de reglas que se emplean en un método híbrido de categorización automática de texto. Este método combina un algoritmo de aprendizaje computacional con diferentes sistemas basados en reglas en cascada empleados para el filtrado y reordenación de los resultados proporcionados por dicho modelo base. Aquí se describe una implementación realizada mediante el algoritmo kNN y un lenguaje básico de reglas basado en listas de términos que aparecen en el texto a clasificar. Para la evaluación se utiliza el corpus de noticias Reuters-21578. Los resultados demuestran que los métodos de generación de reglas propuestos producen resultados muy próximos a los obtenidos con la aplicación de reglas generadas manualmente y que el sistema híbrido propuesto obtiene una precisión y cobertura comparables a la de los mejores métodos del estado del arte.

More information

Item ID: 12322
DC Identifier: http://oa.upm.es/12322/
OAI Identifier: oai:oa.upm.es:12322
Official URL: http://sinai.ujaen.es/sepln/ojs/ojs/index.php/pln/article/view/980
Deposited by: Memoria Investigacion
Deposited on: 28 Aug 2012 08:37
Last Modified: 21 Apr 2016 11:34
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM