Accuracy Comparison of CNN, LSTM, and Transformer for Activity Recognition Using IMU and Visual Markers

Trujillo Guerrero, María Fernanda ORCID: https://orcid.org/0000-0002-7250-6479, Román Niemes, Stadyn ORCID: https://orcid.org/0000-0001-7714-2582, Jaén Vargas, Milagros Quilimara ORCID: https://orcid.org/0000-0001-6350-401X, Cádiz, Alfonso, Fonseca, Rircardo ORCID: https://orcid.org/0000-0003-0998-4440 and Serrano Olmedo, José Javier ORCID: https://orcid.org/0000-0002-8544-8933 (2023). Accuracy Comparison of CNN, LSTM, and Transformer for Activity Recognition Using IMU and Visual Markers. "IEEE Access", v. 11 ; pp. 106650-106669. ISSN 2169-3536. https://doi.org/10.1109/ACCESS.2023.3318563.

Descripción

Título: Accuracy Comparison of CNN, LSTM, and Transformer for Activity Recognition Using IMU and Visual Markers
Autor/es:
Tipo de Documento: Artículo
Título de Revista/Publicación: IEEE Access
Fecha: 25 Septiembre 2023
ISSN: 2169-3536
Volumen: 11
Materias:
Palabras Clave Informales: Reconocimiento de actividad humana; aprendizaje profundo; inteligencia artificial; sensores inerciales; procesamiento de imágenes de movimiento
Escuela: Centro de Tecnología Biomédica (CTB) (UPM)
Departamento: Tecnología Fotónica y Bioingeniería
Grupo Investigación UPM: Tecnologías de Apoyo a la Vida
Licencias Creative Commons: Reconocimiento

Texto completo

[thumbnail of 6_Accuracy_Comparison_of_CNN_LSTM.pdf] PDF (Portable Document Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (5MB)

Resumen

"El reconocimiento de la actividad humana (HAR) tiene aplicaciones que van desde la seguridad hasta la atención sanitaria. Por lo general, estos sistemas se componen de modelos de adquisición de datos y reconocimiento de actividad. En este trabajo, comparamos la precisión de dos sistemas de adquisición: Unidades de Medición Inercial (IMUs) vs Sistemas de Análisis de Movimiento (MAS). Entrenamos modelos para reconocer ejercicios de brazos utilizando aprendizaje profundo de última generación arquitecturas y comparó su precisión. MAS utiliza un conjunto de cámaras y marcadores reflectantes. IMU utiliza acelerómetros, giroscopios y magnetómetros. Los sensores de ambos sistemas se colocaron en diferentes ubicaciones de la extremidad superior. Capturamos y anotamos 3 conjuntos de datos, cada uno utilizando ambos sistemas simultáneamente. Para el reconocimiento de actividades, entrenamos 8 arquitecturas, cada una con diferentes operaciones y configuraciones de capas. Las mejores arquitecturas fueron una combinación de CNN, LSTM y Transformer, logrando una precisión de prueba del 89% al 99% en promedio. Evaluamos cómo la selección de características redujo los sensores necesarios. Encontramos que los datos de IMU y MAS fueron capaces de distinguir correctamente los ejercicios de brazo. Al principio, las capas de CNN producían una mayor precisión en conjuntos de datos difíciles. La IMU tenía ventajas sobre otros sistemas de adquisición para el reconocimiento de actividades. Analizamos las relaciones entre la precisión de los modelos, las formas de onda de la señal, la correlación de las señales, la frecuencia de muestreo, la duración del ejercicio y el tamaño de la ventana. Finalmente, se propuso el uso de una única IMU ubicada en la muñeca y una extracción de ventana de tamaño variable."

Más información

ID de Registro: 85448
Identificador DC: https://oa.upm.es/85448/
Identificador OAI: oai:oa.upm.es:85448
URL Portal Científico: https://portalcientifico.upm.es/es/ipublic/item/10104356
Identificador DOI: 10.1109/ACCESS.2023.3318563
URL Oficial: https://ieeexplore.ieee.org/document/10261772
Depositado por: Prof. José Javier Serrano Olmedo
Depositado el: 23 Dic 2024 17:15
Ultima Modificación: 23 Dic 2024 17:15