Extensión funcional de CluSim para tolerancia a fallos

El rendimiento de un sistema paralelo depende tanto de la configuración de recursos de la computadora, como del tipo de aplicación a ejecutar. Por ello, el estudio del comportamiento de aplicaciones paralelas en clusters, considerando diferentes configuraciones, permitiría establecer qué configuraci...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Pérez Otero, Nilda, Valdiviezo, Luis M., Pérez Ibarra, Marcelo, Lasserre, Cecilia María, Montejano, Germán Antonio
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2011
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/19583
Aporte de:
Descripción
Sumario:El rendimiento de un sistema paralelo depende tanto de la configuración de recursos de la computadora, como del tipo de aplicación a ejecutar. Por ello, el estudio del comportamiento de aplicaciones paralelas en clusters, considerando diferentes configuraciones, permitiría establecer qué configuración resulta más adecuada de acuerdo al tipo de aplicación. Además, otro factor a considerar es la ocurrencia de fallos en el sistema paralelo y la presencia de un sistema robusto de tolerancia a fallos que mantenga disponible la aplicación. El estudio de rendimiento de estos sistemas no es fácil, ya que implica detener el cluster en funcionamiento y reconfigurar sus recursos para llevar a cabo la evaluación de rendimiento o inyectar fallos en el cluster a fin de analizar el comportamiento del sistema tolerante a fallos; todo esto con el consecuente impacto en tiempo y costo. CluSim es un simulador de cluster para aplicaciones paralelas, basado en OMNeT++, que permite parametrizar la configuración de un cluster de modo que sea posible evaluar y predecir el impacto en el rendimiento de diferentes configuraciones para distintos tipos de aplicaciones. En la actual línea de investigación se pretende extender la funcionalidad del simulador CluSim para incluir aspectos de tolerancia a fallos.