Optimizing communication by compression for Multi-GPU Scalable Breadth-First Searches

Romera Juarez, Julián (2016). Optimizing communication by compression for Multi-GPU Scalable Breadth-First Searches. Trabajo Fin de Grado / Proyecto Fin de Carrera, E.T.S. de Ingenieros Informáticos (UPM), Madrid, España.

Descripción

Título:	Optimizing communication by compression for Multi-GPU Scalable Breadth-First Searches
Autor/es:	Romera Juarez, Julián
Director/es:	Fröning, Holger
Tipo de Documento:	Trabajo Fin de Grado o Proyecto Fin de Carrera
Fecha:	2016
Materias:	Informática
ODS:	09. Industria, innovación e infraestructura
Palabras Clave Informales:	Breath-First Search; Graph500; Compression
Escuela:	E.T.S. de Ingenieros Informáticos (UPM)
Departamento:	Otro
Licencias Creative Commons:	Reconocimiento - Sin obra derivada - No comercial

Texto completo

Vista Previa

PDF (Portable Document Format) - Se necesita un visor de ficheros PDF, como GSview, Xpdf o Adobe Acrobat Reader
Descargar (2MB) | Vista Previa

Resumen

Debido al creciente aumento del tamaño de los datos en muchos de los actuales
sistemas de información, muchos de los algoritmos de recorrido de estas
estructuras pierden rendimento para realizar búsquedas en estos.
Debido a que la representacion de estos datos en muchos casos se realiza mediante
estructuras nodo-vertice (Grafos), en el año 2009 se creó el reto Graph500. Con
anterioridad, otros retos como Top500 servían para medir el rendimiento en base a
la capacidad de cálculo de los sistemas, mediante tests LINPACK. En caso de
Graph500 la medicion se realiza mediante la ejecución de un algoritmo de recorrido
en anchura de grafos (BFS en inglés) aplicada a Grafos. El algoritmo BFS es uno de
los pilares de otros muchos algoritmos utilizados en grafos como SSSP, shortest path
o Betweeness centrality. Una mejora en este ayudaría a la mejora de los otros que lo
utilizan.
Analisis del Problema
El algoritmos BFS utilizado en los sistemas de computación de alto rendimiento
(HPC en ingles) es usualmente una version para sistemas distribuidos del algoritmo
secuencial original. En esta versión distribuida se inicia la ejecución realizando un
particionado del grafo y posteriormente cada uno de los procesadores distribuidos
computará una parte y distribuirá sus resultados a los demás sistemas.
Debido a que la diferencia de velocidad entre el procesamiento en cada uno de estos
nodos y la transfencia de datos por la red de interconexión es muy alta (estando en
desventaja la red de interconexion) han sido bastantes las aproximaciones tomadas
para reducir la perdida de rendimiento al realizar transferencias. Respecto al
particionado inicial del grafo, el enfoque tradicional (llamado 1D-partitioned graph
en ingles) consiste en asignar a cada nodo unos vertices fijos que él procesará. Para
disminuir el tráfico de datos se propuso otro particionado (2D) en el cual la
distribución se haciá en base a las aristas del grafo, en vez de a los vertices. Este
particionado reducía el trafico en la red en una proporcion O(NxM) a O(log(N)). Si
bien han habido otros enfoques para reducir la transferecnia como: reordemaniento
inicial de los vertices para añadir localidad en los nodos, o particionados dinámicos,
el enfoque que se va a proponer en este trabajo va a consistir en aplicar técnicas
recientes de compression de grandes sistemas de datos como Bases de datos de alto
volume o motores de búsqueda en internet para comprimir los datos de las
transferencias entre nodos.---ABSTRACT---The Breadth First Search (BFS) algorithm is the foundation and building block
of many higher graph-based operations such as spanning trees, shortest paths and
betweenness centrality. The importance of this algorithm increases each day due
to it is a key requirement for many data structures which are becoming popular
nowadays. These data structures turn out to be internally graph structures.
When the BFS algorithm is parallelized and the data is distributed into several
processors, some research shows a performance limitation introduced by the
interconnection network [31]. Hence, improvements on the area of communications
may benefit the global performance in this key algorithm.
In this work it is presented an alternative compression mechanism. It differs with
current existing methods in that it is aware of characteristics of the data which
may benefit the compression.
Apart from this, we will perform a other test to see how this algorithm (in a dis-
tributed scenario) benefits from traditional instruction-based optimizations. Last,
we will review the current supercomputing techniques and the related work being
done in the area.

Más información

ID de Registro:	40842
Identificador DC:	https://oa.upm.es/40842/
Identificador OAI:	oai:oa.upm.es:40842
Depositado por:	Biblioteca Facultad de Informatica
Depositado el:	07 Jun 2016 13:33
Ultima Modificación:	07 Jun 2016 13:34

Estadísticas

Exportar cita

Editar (sólo personal del Archivo)

En esta página

Menú principal

Buscar

Optimizing communication by compression for Multi-GPU Scalable Breadth-First Searches

Cita

Descripción

Texto completo

Resumen

Más información

Acciones

Documentos

El repositorio

Agrupados por ...

Datos Investigación

Financiadores

Especiales

En otros formatos

Redes sociales

Información adicional