ECG time series data mining for cardiovascular disease risk assessment

Méndez Calderón, Allan de Brito (2016). ECG time series data mining for cardiovascular disease risk assessment. Tesis (Master), E.T.S. de Ingenieros Informáticos (UPM).

Descripción

Título: ECG time series data mining for cardiovascular disease risk assessment
Autor/es:
  • Méndez Calderón, Allan de Brito
Director/es:
  • Pérez Pérez, Aurora
  • Caraça-Valente Hernández, Juan Pedro
Tipo de Documento: Tesis (Master)
Título del máster: Software y Sistemas
Fecha: Julio 2016
Materias:
Escuela: E.T.S. de Ingenieros Informáticos (UPM)
Departamento: Lenguajes y Sistemas Informáticos e Ingeniería del Software
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (5MB) | Vista Previa

Resumen

Chronic diseases require ongoing care to improve patients’ quality of life. It demands large amount of investment from governments and companies including employee absenteeism, early retirement and social spend. Nowadays it is estimated that 12% of natural death occurs suddenly, in which 88% of them is related to cardiac origin [1]. Indeed, cardiovascular diseases are the first cause of mortality in Spain with more than 123,000 cases and investments estimated in €2 billon annually, representing 0.2% of gross domestic product (GDP). On one hand, the proportional incidence (per 1,000 habitants) of acute myocardial infarction is stable on population between 25 and 74 years. On the other hand, it is estimated increasing by 1.5% the number of heart attack because of the population aging [2]. However, chronic cardiac disease can be fully or partially prevented. Firstly, following healthy lifestyle habits. It is estimated that around 75% of the causes of cardiovascular disease is related to factors such as smoking, sedentary lifestyle, hypertension, diabetes or obesity. Secondly, it is possible to prevent by early detection [2]. This work introduces time series data mining models for analyzing electrocardiograms (ECG) in order to identify heart attack pre-events and the probability of incidence. This information could support patients in searching proper treatment minutes before the cardiac arrest. The techniques selected for training the models are decision tree, k-nearest neighbors (kNN), support vector machine (SVM), logistic regression and neural networks. It will be used the Physionet [3] project for gathering ECG information, particularly from two databases: Sudden Cardiac Death Holter [4] and Fantasia [5]. The first one consists 24-hour records from 23 people that suffered hearth attacks during ECG monitoring. The other database is a 2-hour record from 40 healthy people. The data mining signatures are composed by 2-minutes databases excerpts, in which the outcome will be the probability of hearth attack incidents. These signatures are random selected from healthy people database and excerpts of specific pre-events from victims that suffered sudden cardiac death. Overall, this model can bring up hidden information from ECGs in order to predict Ventricular Fibrillation (VF) events making possible send alerts for patients and physicians.---ABSTRACT---Las enfermedades crónicas no tienen cura y exigen cuidados constantes para mejorar la calidad de vida de los pacientes. Los gobiernos y empresas tienen que afrontar costos elevados por tratamientos, absentismo laboral, jubilaciones anticipadas y gastos sociales de estos enfermos. Por otra parte, se estima que 12% de las muertes naturales ocurren de repente y que un 88% de éstas se deben a problemas cardíacos [1]. Las enfermedades cardiovasculares constituyen la primera causa de muerte en España, con más de 120.000 fallecimientos y costes de aproximadamente 2.000 millones de euros anuales (0,2% del PIB). Aunque la incidencia de los infartos agudos se mantiene estable, se estima que cada año aumentará un 1,5% el número de casos de infarto y angina debido al envejecimiento de la población [2]. La prevención de las enfermedades cardiovasculares es, por tanto, una cuestión de gran relevancia. Por una parte, se pueden prevenir antes de que se presenten, siguiendo hábitos de vida saludables. Por ejemplo, se estima que en torno a un 75% de las causas de enfermedad cardiovascular están relacionadas con factores como el tabaquismo, el sedentarismo, la hipertensión, la diabetes o la obesidad. Por otra parte, la prevención puede ser abordada mediante la detección precoz [2]. En la línea de la detección precoz se enfoca el presente trabajo, en el que se propone la utilización de modelos de data mining con el objetivo de clasificar preeventos con alta probabilidad de paro cardíaco. Esta información permitiría a los pacientes demandar la ayuda adecuada minutos antes de un paro cardíaco. Los datos utilizados en la construcción de los modelos son series temporales correspondientes a ECG mientras que las técnicas utilizadas para el entrenamiento de los modelos son árbol de decisión, K-vecinos más cercanos, máquina de vectores de soporte, regresión logística y redes neuronales. Los datos se han extraído de la plataforma Physionet [3] y, en particular, de dos de las bases de datos contenidas en ella: Sudden Cardiac Death Holter [4] y Fantasia [5]. De cada sujeto se ha tomado un extracto de 2 minutos de ECG, seleccionado de manera aleatoria para sujetos saludables mientras que, para el caso de pacientes que han sufrido paros cardíacos, se han seleccionando los 2 minutos que preceden al evento. En general, los modelos pueden descubrir información oculta en los electrocardiogramas que permita la predicción de Fibrilación Ventricular (VF) lo cual puede ser usado, por ejemplo, para enviar alertas a pacientes y médicos.

Más información

ID de Registro: 43314
Identificador DC: http://oa.upm.es/43314/
Identificador OAI: oai:oa.upm.es:43314
Depositado por: Biblioteca Facultad de Informatica
Depositado el: 14 Sep 2016 12:09
Ultima Modificación: 15 Sep 2016 08:54
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • e-ciencia
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM