Metodología para predecir el consumo energético de checkpoints en sistemas de HPC

Mientras el rendimiento de los sistemas de computación de altas prestaciones continúa creciendo, las máquinas aumentan signi ficativamente en cantidad de unidades de procesamiento. Esto hace que la tolerancia a fallos y el consumo energético se conviertan en factores cada vez más relevantes. Los mét...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Balladini, Javier, Morán, Marina, Rexachs del Rosario, Dolores, luque
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2014
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/42391
Aporte de:
Descripción
Sumario:Mientras el rendimiento de los sistemas de computación de altas prestaciones continúa creciendo, las máquinas aumentan signi ficativamente en cantidad de unidades de procesamiento. Esto hace que la tolerancia a fallos y el consumo energético se conviertan en factores cada vez más relevantes. Los métodos de tolerancia a fallos tienen fuerte incidencia en el consumo energético, y resulta de suma importancia conocer, antes de ejecutar una cierta aplicación, el impacto que pueden producir los diferentes métodos y confi guraciones del mismo. En este trabajo, presentamos una metodología para predecir el consumo energético producido por el método de checkpoint coordinado remoto. La metodología se basa en una caracterización energética del sistema, una caracterízación de la aplicación, y un modelo analítico que se instancia con los parámetros caracterizados. El modelo permite predecir la energíaque consumirán los checkpoints para cualquier tamaño de problema y frecuencia de CPU de ejecución de checkpoints. Los resultados de las predicciones muestran una precisión mayor al 95 %.