Identificación de objetos mediante el análisis de una señal radar. Desarrollo de un modelo de simulación cooperativo

Álvarez Pastor, Marta (2016). Identificación de objetos mediante el análisis de una señal radar. Desarrollo de un modelo de simulación cooperativo. Proyecto Fin de Carrera / Trabajo Fin de Grado, E.T.S.I. Industriales (UPM).

Descripción

Título: Identificación de objetos mediante el análisis de una señal radar. Desarrollo de un modelo de simulación cooperativo
Autor/es:
  • Álvarez Pastor, Marta
Director/es:
  • Moreno González, Félix
  • Villaverde San José, Mónica
Tipo de Documento: Proyecto Fin de Carrera/Grado
Grado: Grado en Ingeniería en Tecnologías Industriales
Fecha: Septiembre 2016
Materias:
Palabras Clave Informales: Modelo multiagente, algoritmos cooperativos, votación ponderada, filtro de part.
Escuela: E.T.S.I. Industriales (UPM)
Departamento: Automática, Ingeniería Eléctrica y Electrónica e Informática Industrial
Licencias Creative Commons: Reconocimiento - Sin obra derivada - No comercial

Texto completo

[img]
Vista Previa
PDF (Document Portable Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (5MB) | Vista Previa

Resumen

Este Trabajo Fin de Grado (TFG) ha surgido como continuación de investigaciones anteriores asociadas al proyecto denominado “TECALUM: Sistema de Iluminación Inteligente”, desarrollado en el Centro de Electrónica Industrial (CEI) de la Universidad Politécnica de Madrid. El objetivo perseguido en dicho proyecto es controlar la intensidad del alumbrado público en función de las necesidades de la vía. Para la realización de estos proyectos se dispone de un radar de bajo coste modelo MDU4200 y un DSP (Digital Signal Processor), perteneciente a la familia 33F de Microchip, integrado en una plataforma hardware denominada TECALUM. Dicha plataforma es capaz de detectar la presencia de personas y vehículos en movimiento, analizando la señal proporcionada por el radar. Para la clasificación de la señal dentro de una de las 3 categorías establecidas (persona, coche o grupo de personas), se utiliza un árbol de decisión probabilístico. Este permite alcanzar tasas de acierto cercanas a un 80%, pero es posible incrementar dicha fiabilidad, combinando las identificaciones individuales de varios radares. En la actualidad, el número de aplicaciones basadas en modelos multiagentes se está incrementando fuertemente. En líneas generales, se define un modelo multiagente a un sistema formado por varios agentes que trabajan conjuntamente para alcanzar un objetivo común. Cada uno de estos agentes se caracteriza por tener un comportamiento autónomo, capaz de percibir información del entorno y actuar en consecuencia simulando algún tipo de inteligencia. Además, ciertos agentes pueden poseer un estado interno determinado por la previa evolución del entorno que les rodea. Utilizando algún mecanismo de aprendizaje, es posible hacer uso de dicho estado, para alcanzar los objetivos con una mayor eficiencia. Se considera que un agente aprende si es capaz de modificar algún parámetro que lo caracteriza, para adaptarse a un entorno de trabajo variable. Para implementar un modelo multiagente en el proyecto TECALUM, se capturan tres muestras de un mismo objeto utilizando tres radares diferentes. Estos se disponen de tal forman que observan el mismo objeto pero desde puntos de vistas distintos. Posteriormente, de cada señal se extraen ciertos parámetros que se introducen en el árbol de decisión y así se genera para cada agente, una hipótesis individual de la categoría a la que pertenece la muestra. Por último, se recopilan las 3 hipótesis y se obtiene un resultado cooperativo aplicando un algoritmo de decisión. Existen diversos mecanismos colaborativos que hacen uso de la inteligencia artificial para recopilar la información individual de cada agente. El objetivo principal de este Trabajo Fin de Grado es realizar una comparativa entre 5 algoritmos cooperativos distintos para destacar el más adecuado en términos de fiabilidad, coste computacional, coste económico, horas de desarrollo y tiempo de respuesta. Aunque en este trabajo se utilicen datos de una aplicación específica, la elección de la arquitectura más óptima se llevará a cabo desde una perspectiva generalista para poder extrapolarla a otras aplicaciones que hagan uso de un modelo multiagente. Los tres primeros algoritmos fueron planteados en un TFM anterior. Sin embargo, en este trabajo también se han estudiado y programado por el interés que presentan. El primer algoritmo utilizado consiste en identificar la categoría a la que pertenece la muestra realizando una votación con las hipótesis individuales de todos los agentes. Se considera que todos los votos contribuyen a la votación con el mismo peso. El resultado cooperativo se determina por consenso mayoritario, es decir, coincide con la categoría que recibe un mayor número de votos. La decisión cooperativa en el segundo algoritmo también se obtiene realizando una votación, pero en este caso, el voto de cada nodo se pondera con un determinado valor. Para ello, a cada agente se le asigna un peso en relación a la tasa de acierto obtenida en las últimas identificaciones. Este peso es de carácter individual y clasifica a cada nodo como “buen o mal identificador” en términos generales, sin hacer referencia a ninguna categoría. Por ello, se denomina a este algoritmo, Algoritmo basado en pesos globales. En el algoritmo 3, también se lleva a cabo una votación ponderada, pero ahora sí se establecen una serie de pesos por nodo y por categoría. Esto permite distinguir agentes expertos en la identificación de una categoría determinada. Se conoce a este algoritmo como Algoritmo basado en pesos condicionados. Para que estos dos últimos algoritmos sean eficientes, es necesario modificar el valor de los pesos tras cada identificación. Si la identificación individual del nodo coincide con el resultado de la mayoría ponderada, se recompensa a dicho nodo aumentado el valor de su peso. Si por el contrario, un agente no ha contribuido al resultado cooperativo, se le penaliza disminuyendo el valor de su peso. De esta forma, se implementa un mecanismo de aprendizaje basado en premios y castigos dependiendo del comportamiento de cada agente. El factor de corrección de los pesos viene determinado por un valor constante que se ha denominado tasa de aprendizaje. Dicha constante es decidida por el usuario programador del algoritmo. Por lo tanto, estos algoritmos no tienen un comportamiento totalmente autónomo porque dependen de la tasa de aprendizaje elegida y el valor de inicialización de cada peso. Para evitar la dependencia de un usuario exterior al sistema, se desarrollan dos nuevos algoritmos basados en un filtro de partículas. Un filtro de partículas es un algoritmo probabilístico dentro de los métodos de Montecarlo que hace uso de la inferencia bayesiana para estimar el comportamiento de un sistema dependiendo de un conjunto de hipótesis de referencia. Las principales aplicaciones en las que se aplica dicho algoritmo se relacionan con el rastreo de objetos en movimiento. En líneas generales, y sin entran en detalle de fórmulas matemáticas, un filtro de partículas se compone, como su nombre indica, de un conjunto de partículas cuya posición permite estimar el estado de un sistema variable con el tiempo. La aplicación estudiada en este TFG no se basa en el rastreo de un objeto, sin embargo, es posible extraer el concepto en el que se fundamenta el modelo de Montecarlo para desarrollar dos nuevos algoritmos. Tras cada identificación es necesario ir delimitando el espacio de trabajo. No es posible asignar un peso a cada partícula en función de la distancia al centro geométrico porque la nube convergería siempre en el mismo punto, disminuyente únicamente el área ocupado. Por lo tanto, se propone llevar a cabo una división jerárquica entre las partículas, aprovechando que es posible obtener un resultado cooperativo específico para cada una de ellas, utilizando sus coordenadas como pesos de la votación. La comparación de dicho resultado con el obtenido considerando el centro geométrico, permite hacer una distinción entre partículas correctas e incorrectas. A su vez, dentro de las partículas correctas se estable una segunda división en función de un valor denominado como margen de error. Se define el margen de error como la diferencia entre la aportación máxima conseguida por la categoría ganadora de la votación y el resto de categorías. A mayor margen de error de una partícula, mayor es la fiabilidad de su resultado cooperativo. En términos generales, el comportamiento del algoritmo 2 y 4 es muy similar. Ambos asignan un peso a cada nodo para ponderar su hipótesis individual. Sin embargo, existen dos diferencias destacables. En el caso del algoritmo 2 el valor del peso se puede conocer directamente y en cambio, en el algoritmo 4, es necesario calcular el centro geométrico de todas las partículas. La segunda diferencia se observa a la hora de la actualizar el valor de dicho. En el caso del algoritmo 2, únicamente se necesita una constante recibida como parámetro mientras que en el algoritmo 4, se requiere modificar la posición de todas las partículas. Por lo tanto, aunque el algoritmo 4 presente mayor autonomía no es un argumento notable para desbancar la sencillez del algoritmo 2. Recopilando todos los aspectos considerados se puede concluir que el algoritmo más adecuado en términos de fiabilidad, adaptación, coste computacional y horas de desarrollo es el algoritmo 2. Una posible continuación de este trabajo podría basarse en la implementación de dicho algoritmo en el microchip del radar para poder comprobar su respuesta trabajando en la vía pública.

Más información

ID de Registro: 43521
Identificador DC: http://oa.upm.es/43521/
Identificador OAI: oai:oa.upm.es:43521
Depositado por: Biblioteca ETSI Industriales
Depositado el: 19 Oct 2016 07:54
Ultima Modificación: 19 Oct 2016 07:54
  • Open Access
  • Open Access
  • Sherpa-Romeo
    Compruebe si la revista anglosajona en la que ha publicado un artículo permite también su publicación en abierto.
  • Dulcinea
    Compruebe si la revista española en la que ha publicado un artículo permite también su publicación en abierto.
  • Recolecta
  • e-ciencia
  • Observatorio I+D+i UPM
  • OpenCourseWare UPM