SEDAR: Detectando y recuperando fallos transitorios en aplicaciones de HPC
El manejo de fallos es una preocupación creciente en HPC; en el futuro, se esperan mayores variedades y tasas de errores, intervalos de detección más largos y fallos silenciosos. Se proyecta que, en sistemas de exa-escala, los errores ocurran varias veces al día y se propaguen para generar desde caí...
Guardado en:
| Autores principales: | Montezanti, Diego Miguel, Rucci, Enzo, Rexachs del Rosario, Dolores, Luque Fadón, Emilio, Naiouf, Marcelo, De Giusti, Armando Eduardo |
|---|---|
| Formato: | Objeto de conferencia |
| Lenguaje: | Español |
| Publicado: |
2019
|
| Materias: | |
| Acceso en línea: | http://sedici.unlp.edu.ar/handle/10915/90527 |
| Aporte de: |
Ejemplares similares
-
Caracterización de una estrategia de detección de fallos transitorios en HPC
por: Montezanti, Diego Miguel, et al.
Publicado: (2015) -
SEDAR: Detección y recuperación automática de fallos transitorios en sistemas de cómputo de altas prestaciones
por: Montezanti, Diego Miguel
Publicado: (2020) -
Resumen de tesis: SEDAR: Detección y recuperación automática de fallos transitorios en sistemas de cómputo de altas prestaciones
por: Montezanti, Diego Miguel
Publicado: (2020) -
Power characterisation of shared-memory hpc systems
por: Balladini, Javier, et al.
Publicado: (2012) -
Simulador de un cluster tolerante a fallos basado en OMNeT++
por: Pérez Ibarra, Marcelo, et al.
Publicado: (2010)