Abstract
El propósito de este trabajo consiste en la exploración de segmentos de audio no etiquetados extraídos del canto de ballenas jorobadas y la búsqueda de aplicaciones de la inteligencia artificial que puedan explotar estos datos. Tras un vasto estudio del estado del arte, se ha diseñado una secuencia de dos modelos de redes neuronales que tendrán como objetivo organizar estos segmentos de audio en grupos a razón de su similitud mediante un algoritmo de aprendizaje no supervisado comúnmente conocido: el Mapa Autoorganizado. Se ha optado por recurrir a un preprocesado de los datos con el objetivo de reducir el ruido y la información no relevante. De esta manera se consigue optimizar el entrenamiento del modelo de agrupación. Para ello se hace uso de un Autoencoder que reduce la dimensionalidad del espectrograma del sonido, acelerando el proceso de aprendizaje del Mapa Autoorganizado.---ABSTRACT---The purpose of this study consists on the exploratory analysis over a set of audio chunks, cropped from humpback whales’ full songs and researching on artificial intelligence applications which may allow us exploit this data. Upon a vast state of the art study, it is proposed a two-models neural networks sequence which aims to group these data segments by similarity, making use of a wellknown non-supervised grouping algorithm: Self Organized Map. Beforehand, data is applied a preprocessing technique in order to get its noise and complexity reduced at most as a means to enhance the grouping model’s training process and performance: an Autoenconder performs this task.