Extensión de CluSim: Simulación de la arquitectura tolerante a fallos RADIC

Los sistemas de Cómputo de Altas Prestaciones se utilizan para desarrollar software en una gran cantidad de campos. Es evidente el creciente predominio e impacto de las aplicaciones del Cómputo de Altas Prestaciones (High Performance Computing - HPC) en la sociedad moderna. Sin embargo, la presencia...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Lasserre, Cecilia María, Pérez Otero, Nilda, Verazay, Abigaíl R. N.
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2012
Materias:
HPC
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/19308
Aporte de:
Descripción
Sumario:Los sistemas de Cómputo de Altas Prestaciones se utilizan para desarrollar software en una gran cantidad de campos. Es evidente el creciente predominio e impacto de las aplicaciones del Cómputo de Altas Prestaciones (High Performance Computing - HPC) en la sociedad moderna. Sin embargo, la presencia de fallos en el hardware o software de computadores paralelos hace necesario el uso de mecanismos tolerantes a fallos para asegurar que las aplicaciones finalicen exitosamente. Para ello se ha desarrollado RADIC, una arquitectura transparente, descentralizada, flexible y escalable para tolerancia a fallos que provee alta disponibilidad en sistemas de paso de mensajes. La falta de disponibilidad física de grandes clusters y el hecho de estar ligado a una implementación específica de MPI como base, son las principales dificultades con las que se encontraron los desarrolladores de RADIC. Como una solución a estos problemas el presente proyecto de investigación propone el desarrollo de un entorno de simulación para RADIC basado en OMNeT++, a partir de CLUSIM (Simulador de clusters basado en OMNet++).