Extensión de CluSim: Simulación de la arquitectura tolerante a fallos RADIC
Los sistemas de Cómputo de Altas Prestaciones se utilizan para desarrollar software en una gran cantidad de campos. Es evidente el creciente predominio e impacto de las aplicaciones del Cómputo de Altas Prestaciones (High Performance Computing - HPC) en la sociedad moderna. Sin embargo, la presencia...
Guardado en:
| Autores principales: | , , |
|---|---|
| Formato: | Objeto de conferencia |
| Lenguaje: | Español |
| Publicado: |
2012
|
| Materias: | |
| Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/19308 |
| Aporte de: |
| Sumario: | Los sistemas de Cómputo de Altas Prestaciones se utilizan para desarrollar software en una gran cantidad de campos. Es evidente el creciente predominio e impacto de las aplicaciones del Cómputo de Altas Prestaciones (High Performance Computing - HPC) en la sociedad moderna. Sin embargo, la presencia de fallos en el hardware o software de computadores paralelos hace necesario el uso de mecanismos tolerantes a fallos para asegurar que las aplicaciones finalicen exitosamente. Para ello se ha desarrollado RADIC, una arquitectura transparente, descentralizada, flexible y escalable para tolerancia a fallos que provee alta disponibilidad en sistemas de paso de mensajes. La falta de disponibilidad física de grandes clusters y el hecho de estar ligado a una implementación específica de MPI como base, son las principales dificultades con las que se encontraron los desarrolladores de RADIC. Como una solución a estos problemas el presente proyecto de investigación propone el desarrollo de un entorno de simulación para RADIC basado en OMNeT++, a partir de CLUSIM (Simulador de clusters basado en OMNet++). |
|---|