Método para la búsqueda de patrones similares en series temporales simbólicas

Valencia Suárez, Bryan (2018). Método para la búsqueda de patrones similares en series temporales simbólicas. Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).

Description

Title: Método para la búsqueda de patrones similares en series temporales simbólicas
Author/s:
  • Valencia Suárez, Bryan
Contributor/s:
  • Caraça-Valente Hernández, Juan Pedro
  • Pérez Pérez, Aurora
Item Type: Thesis (Master thesis)
Masters title: Software y Sistemas
Date: July 2018
Subjects:
Faculty: E.T.S. de Ingenieros Informáticos (UPM)
Department: Lenguajes y Sistemas Informáticos e Ingeniería del Software
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (1MB) | Preview

Abstract

Las series temporales simbólicas constituyen una estrategia para la reducción de dimensionalidad y en muchos casos para la mejora en la interpretación de las series temporales numéricas originales. La aplicación de técnicas de Data Mining en estos conjuntos de símbolos en lugar de en valores numéricos representa algunos retos particulares que son actualmente campos activos de investigación. Dentro de estas tareas de Data Mining se encuentra lo que se denomina descubrimiento de patrones, que consiste en el hallazgo de sub-secuencias frecuentes entre series simbólicas de un mismo conjunto. En el presente trabajo se propone un método para la búsqueda de patrones similares en series temporales simbólicas en el que se abarcan y solucionan las necesidades propias de este tipo de conjunto de datos. Entre otras necesidades, está el hecho de que la aplicación del principio de A priori puede condicionar y ser desfavorable para una búsqueda íntegra de patrones similares. Por esta razón el algoritmo planteado integra una estrategia para permitir la reducción de la rigurosidad del principio de A priori garantizando una búsqueda exhaustiva con un costo computacional acorde a los requerimientos del problema. En el trabajo también se presenta un proceso de evaluación en el que se crea y ejecuta un clasificador de series temporales basado en los patrones descubiertos por el método diseñado. Los resultados muestran que el método de descubrimiento de patrones, además de satisfacer las restricciones y condiciones propuestas, está siendo efectivo en generar patrones que realmente extraen las características de un conjunto de series que describen un mismo comportamiento o fenómeno. Para este proceso de evaluación se eligieron 15 de los conjuntos de series del repositorio de clasificación de la Universidad de California, Riverside.---ABSTRACT---Symbolic time series are a strategy for dimensionality reduction and in many cases it is also used to enhance interpretation of the original numerical time series. The application of Data Mining techniques in these sets of symbols instead of numerical values represents some particular challenges that are currently active research areas. Within these tasks of Data Mining is what is called pattern discovery, which consists of finding frequent sub-sequences among series belonging to the same set. In the present work a method is proposed to find similar patterns in symbolic time series in which the needs of this type of data sets are covered and solved. Among other needs, there is the fact that the application of the principle of A priori can condition and be unfavorable for an integral search of similar patterns. For this reason, the proposed algorithm integrates a strategy to allow the reduction of the rigor of the A priori principle. This guarantees an exhaustive search with a computational cost according to the requirements of the problem. The work presents an evaluation process in which a time series classifier is created and executed based on the patterns discovered by the designed method. The results show that the method of pattern discovery, besides satisfying the proposed restrictions and conditions, is being effective in generating patterns that really extract the characteristics of a set of series that describe the same behavior or phenomenon. For this evaluation process, 15 of the series sets of the University of California, Riverside classification repository were chosen.

More information

Item ID: 51660
DC Identifier: http://oa.upm.es/51660/
OAI Identifier: oai:oa.upm.es:51660
Deposited by: Biblioteca Facultad de Informatica
Deposited on: 17 Jul 2018 07:02
Last Modified: 17 Jul 2018 07:03
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM