Método para la búsqueda de patrones similares en series temporales simbólicas

Valencia Suárez, Bryan (2018). Método para la búsqueda de patrones similares en series temporales simbólicas. Tesis (Master), E.T.S. de Ingenieros Informáticos (UPM).

Descripción

Título: Método para la búsqueda de patrones similares en series temporales simbólicas
Autor/es:
  • Valencia Suárez, Bryan
Director/es:
  • Caraça-Valente Hernández, Juan Pedro
  • Pérez Pérez, Aurora
Tipo de Documento: Tesis (Master)
Título del máster: Software y Sistemas
Fecha: Julio 2018
Materias:
Escuela: E.T.S. de Ingenieros Informáticos (UPM)
Departamento: Lenguajes y Sistemas Informáticos e Ingeniería del Software
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (1MB) | Vista Previa

Resumen

Las series temporales simbólicas constituyen una estrategia para la reducción de dimensionalidad y en muchos casos para la mejora en la interpretación de las series temporales numéricas originales. La aplicación de técnicas de Data Mining en estos conjuntos de símbolos en lugar de en valores numéricos representa algunos retos particulares que son actualmente campos activos de investigación. Dentro de estas tareas de Data Mining se encuentra lo que se denomina descubrimiento de patrones, que consiste en el hallazgo de sub-secuencias frecuentes entre series simbólicas de un mismo conjunto. En el presente trabajo se propone un método para la búsqueda de patrones similares en series temporales simbólicas en el que se abarcan y solucionan las necesidades propias de este tipo de conjunto de datos. Entre otras necesidades, está el hecho de que la aplicación del principio de A priori puede condicionar y ser desfavorable para una búsqueda íntegra de patrones similares. Por esta razón el algoritmo planteado integra una estrategia para permitir la reducción de la rigurosidad del principio de A priori garantizando una búsqueda exhaustiva con un costo computacional acorde a los requerimientos del problema. En el trabajo también se presenta un proceso de evaluación en el que se crea y ejecuta un clasificador de series temporales basado en los patrones descubiertos por el método diseñado. Los resultados muestran que el método de descubrimiento de patrones, además de satisfacer las restricciones y condiciones propuestas, está siendo efectivo en generar patrones que realmente extraen las características de un conjunto de series que describen un mismo comportamiento o fenómeno. Para este proceso de evaluación se eligieron 15 de los conjuntos de series del repositorio de clasificación de la Universidad de California, Riverside.---ABSTRACT---Symbolic time series are a strategy for dimensionality reduction and in many cases it is also used to enhance interpretation of the original numerical time series. The application of Data Mining techniques in these sets of symbols instead of numerical values represents some particular challenges that are currently active research areas. Within these tasks of Data Mining is what is called pattern discovery, which consists of finding frequent sub-sequences among series belonging to the same set. In the present work a method is proposed to find similar patterns in symbolic time series in which the needs of this type of data sets are covered and solved. Among other needs, there is the fact that the application of the principle of A priori can condition and be unfavorable for an integral search of similar patterns. For this reason, the proposed algorithm integrates a strategy to allow the reduction of the rigor of the A priori principle. This guarantees an exhaustive search with a computational cost according to the requirements of the problem. The work presents an evaluation process in which a time series classifier is created and executed based on the patterns discovered by the designed method. The results show that the method of pattern discovery, besides satisfying the proposed restrictions and conditions, is being effective in generating patterns that really extract the characteristics of a set of series that describe the same behavior or phenomenon. For this evaluation process, 15 of the series sets of the University of California, Riverside classification repository were chosen.

Más información

ID de Registro: 51660
Identificador DC: http://oa.upm.es/51660/
Identificador OAI: oai:oa.upm.es:51660
Depositado por: Biblioteca Facultad de Informatica
Depositado el: 17 Jul 2018 07:02
Ultima Modificación: 17 Jul 2018 07:03
  • GEO_UP4
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • InvestigaM
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM