Sistema de recuperación automática de un supercomputador con arquitectura de cluster

Morales del Olmo, Juan (2008). Sistema de recuperación automática de un supercomputador con arquitectura de cluster. Proyecto Fin de Carrera / Trabajo Fin de Grado, Facultad de Informática (UPM), Madrid, ES.

Description

Title: Sistema de recuperación automática de un supercomputador con arquitectura de cluster
Author/s:
  • Morales del Olmo, Juan
Contributor/s:
  • Miguel Anasagasti, Pedro de
  • Cubo Medina, Óscar
Item Type: Final Project
Date: September 2008
Subjects:
Faculty: Facultad de Informática (UPM)
Department: Arquitectura y Tecnología de Sistemas Informáticos
Creative Commons Licenses: Recognition - No derivative works - Non commercial

Full text

[img]
Preview
PDF - Requires a PDF viewer, such as GSview, Xpdf or Adobe Acrobat Reader
Download (3MB) | Preview

Abstract

El continuo aumento de las necesidades de cómputo de la comunidad científica está ocasionando la proliferación de centros de supercomputación a lo largo del mundo. Desde hace unos años la tendencia es ha utilizar una arquitectura de cluster para la construcción de estas máquinas. Precisamente la UPM cuenta con uno de estos computadores. Se trata de Magerit, el segundo supercomputador más potente de España que se encuentra alojado en el CeSViMa y que alcanza los 16 TFLOPS. Los nodos de cómputo de un sistema de estas características trabajan exhaustivamente casi sin descanso, por eso es frecuente que vayan sufriendo problemas. Las tareas de reparación de nodos consumen mucho tiempo al equipo de administración de CeSViMa y no existen herramientas que agilicen estas labores. El objetivo de este proyecto es dotar de cierta autonomía a Magerit para que pueda recuperar de forma automática sus nodos de cómputo sin la intervención de los administradores del sistema. Al final de este proyecto se obtendrá un sistema software inédito que controlará y mantendrá el buen funcionamiento de los nodos de cómputo de un cluster formado por más de 1200 máquinas.

More information

Item ID: 1175
DC Identifier: http://oa.upm.es/1175/
OAI Identifier: oai:oa.upm.es:1175
Deposited by: Archivo Digital UPM
Deposited on: 06 Oct 2008
Last Modified: 20 Apr 2016 06:43
  • Logo InvestigaM (UPM)
  • Logo GEOUP4
  • Logo Open Access
  • Open Access
  • Logo Sherpa/Romeo
    Check whether the anglo-saxon journal in which you have published an article allows you to also publish it under open access.
  • Logo Dulcinea
    Check whether the spanish journal in which you have published an article allows you to also publish it under open access.
  • Logo de Recolecta
  • Logo del Observatorio I+D+i UPM
  • Logo de OpenCourseWare UPM