Full text
Preview |
PDF
- Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (5MB) | Preview |
Méndez Calderón, Allan de Brito (2016). ECG time series data mining for cardiovascular disease risk assessment. Thesis (Master thesis), E.T.S. de Ingenieros Informáticos (UPM).
Title: | ECG time series data mining for cardiovascular disease risk assessment |
---|---|
Author/s: |
|
Contributor/s: |
|
Item Type: | Thesis (Master thesis) |
Masters title: | Software y Sistemas |
Date: | July 2016 |
Subjects: | |
Faculty: | E.T.S. de Ingenieros Informáticos (UPM) |
Department: | Lenguajes y Sistemas Informáticos e Ingeniería del Software |
Creative Commons Licenses: | Recognition - No derivative works - Non commercial |
Preview |
PDF
- Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (5MB) | Preview |
Chronic diseases require ongoing care to improve patients’ quality of life. It
demands large amount of investment from governments and companies including
employee absenteeism, early retirement and social spend. Nowadays it is estimated that
12% of natural death occurs suddenly, in which 88% of them is related to cardiac origin
[1]. Indeed, cardiovascular diseases are the first cause of mortality in Spain with more
than 123,000 cases and investments estimated in €2 billon annually, representing 0.2%
of gross domestic product (GDP). On one hand, the proportional incidence (per 1,000
habitants) of acute myocardial infarction is stable on population between 25 and 74
years. On the other hand, it is estimated increasing by 1.5% the number of heart attack
because of the population aging [2].
However, chronic cardiac disease can be fully or partially prevented. Firstly,
following healthy lifestyle habits. It is estimated that around 75% of the causes of
cardiovascular disease is related to factors such as smoking, sedentary lifestyle,
hypertension, diabetes or obesity. Secondly, it is possible to prevent by early detection
[2].
This work introduces time series data mining models for analyzing
electrocardiograms (ECG) in order to identify heart attack pre-events and the
probability of incidence. This information could support patients in searching proper
treatment minutes before the cardiac arrest. The techniques selected for training the
models are decision tree, k-nearest neighbors (kNN), support vector machine (SVM),
logistic regression and neural networks.
It will be used the Physionet [3] project for gathering ECG information,
particularly from two databases: Sudden Cardiac Death Holter [4] and Fantasia [5]. The
first one consists 24-hour records from 23 people that suffered hearth attacks during
ECG monitoring. The other database is a 2-hour record from 40 healthy people. The
data mining signatures are composed by 2-minutes databases excerpts, in which the
outcome will be the probability of hearth attack incidents. These signatures are random
selected from healthy people database and excerpts of specific pre-events from victims
that suffered sudden cardiac death. Overall, this model can bring up hidden information
from ECGs in order to predict Ventricular Fibrillation (VF) events making possible
send alerts for patients and physicians.---ABSTRACT---Las enfermedades crónicas no tienen cura y exigen cuidados constantes para
mejorar la calidad de vida de los pacientes. Los gobiernos y empresas tienen que
afrontar costos elevados por tratamientos, absentismo laboral, jubilaciones anticipadas y
gastos sociales de estos enfermos. Por otra parte, se estima que 12% de las muertes
naturales ocurren de repente y que un 88% de éstas se deben a problemas cardíacos [1].
Las enfermedades cardiovasculares constituyen la primera causa de muerte en
España, con más de 120.000 fallecimientos y costes de aproximadamente 2.000
millones de euros anuales (0,2% del PIB). Aunque la incidencia de los infartos agudos
se mantiene estable, se estima que cada año aumentará un 1,5% el número de casos de
infarto y angina debido al envejecimiento de la población [2]. La prevención de las
enfermedades cardiovasculares es, por tanto, una cuestión de gran relevancia. Por una
parte, se pueden prevenir antes de que se presenten, siguiendo hábitos de vida
saludables. Por ejemplo, se estima que en torno a un 75% de las causas de enfermedad
cardiovascular están relacionadas con factores como el tabaquismo, el sedentarismo, la
hipertensión, la diabetes o la obesidad. Por otra parte, la prevención puede ser abordada
mediante la detección precoz [2].
En la línea de la detección precoz se enfoca el presente trabajo, en el que se
propone la utilización de modelos de data mining con el objetivo de clasificar preeventos
con alta probabilidad de paro cardíaco. Esta información permitiría a los
pacientes demandar la ayuda adecuada minutos antes de un paro cardíaco. Los datos
utilizados en la construcción de los modelos son series temporales correspondientes a
ECG mientras que las técnicas utilizadas para el entrenamiento de los modelos son árbol
de decisión, K-vecinos más cercanos, máquina de vectores de soporte, regresión
logística y redes neuronales.
Los datos se han extraído de la plataforma Physionet [3] y, en particular, de dos
de las bases de datos contenidas en ella: Sudden Cardiac Death Holter [4] y Fantasia
[5]. De cada sujeto se ha tomado un extracto de 2 minutos de ECG, seleccionado de
manera aleatoria para sujetos saludables mientras que, para el caso de pacientes que han
sufrido paros cardíacos, se han seleccionando los 2 minutos que preceden al evento.
En general, los modelos pueden descubrir información oculta en los
electrocardiogramas que permita la predicción de Fibrilación Ventricular (VF) lo cual
puede ser usado, por ejemplo, para enviar alertas a pacientes y médicos.
Item ID: | 43314 |
---|---|
DC Identifier: | https://oa.upm.es/43314/ |
OAI Identifier: | oai:oa.upm.es:43314 |
Deposited by: | Biblioteca Facultad de Informatica |
Deposited on: | 14 Sep 2016 12:09 |
Last Modified: | 15 Sep 2016 08:54 |