Multi-target detection in CCTV footage for tracking applications using deep learning techniques

Dimou, A.; Medentzidou, P.; Álvarez García, Federico y Daras, P. (2016). Multi-target detection in CCTV footage for tracking applications using deep learning techniques. En: "IEEE International Conference on Image Processing (ICIP 2016)", 25/09/2016 - 28/09/2016, Phoenix, AZ, USA. pp.. https://doi.org/10.1109/ICIP.2016.7532493.

Descripción

Título: Multi-target detection in CCTV footage for tracking applications using deep learning techniques
Autor/es:
  • Dimou, A.
  • Medentzidou, P.
  • Álvarez García, Federico
  • Daras, P.
Tipo de Documento: Ponencia en Congreso o Jornada (Sin especificar)
Título del Evento: IEEE International Conference on Image Processing (ICIP 2016)
Fechas del Evento: 25/09/2016 - 28/09/2016
Lugar del Evento: Phoenix, AZ, USA
Título del Libro: IEEE International Conference on Image Processing (ICIP 2016)
Título de Revista/Publicación: 2016 IEEE INTERNATIONAL CONFERENCE ON IMAGE PROCESSING (ICIP)
Fecha: 2016
Materias:
Palabras Clave Informales: CCTV, motion blur, PTZ, R-CNN, spatial transformer, RNN
Escuela: E.T.S.I. Telecomunicación (UPM)
Departamento: Señales, Sistemas y Radiocomunicaciones
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (1MB) | Vista Previa

Resumen

Real-world CCTV footage often poses increased challenges in object tracking due to Pan-Tilt-Zoom operations, low camera quality and diverse working environments. Most relevant challenges are moving background, motion blur and severe scale changes. Convolutional neural networks, which offer state-of-the-art performance in object detection, are increasingly utilized to pursue a more efficient tracking scheme. In this work, the use of heterogeneous training data and data augmentation is explored to improve their detection rate in challenging CCTV scenes. Moreover, it is proposed to use the objects' spatial transformation parameters to automatically model and predict the evolution of intrinsic camera parameters and accordingly tune the detector for better performance. The proposed approaches are tested on publicly available datasets and real-world CCTV videos.

Proyectos asociados

TipoCódigoAcrónimoResponsableTítulo
FP7FP7-607480LASIESin especificarSin especificar

Más información

ID de Registro: 46043
Identificador DC: http://oa.upm.es/46043/
Identificador OAI: oai:oa.upm.es:46043
Identificador DOI: 10.1109/ICIP.2016.7532493
URL Oficial: http://ieeexplore.ieee.org/document/7532493/
Depositado por: Memoria Investigacion
Depositado el: 24 May 2017 17:46
Ultima Modificación: 24 May 2017 17:46
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • e-ciencia
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM