Version 3 (modified by tonin, 2 years ago) (diff) |
---|
Monitorización de los trabajos con Ganglia
Ganglia es una interfaz web que permite de forma gráfica y visual monitorizar el rendimiento y el desarrollo de los trabajos en la infraestructura HPC. De un solo vistazo podemos ver el consumo de cpu, memoria, disco, red, etc.; más de un centenar de métricas diferentes.
Podemos ver un gráfico de uso agregado y apilado de todo el cluster, así como gráficas individuales para cada uno de los nodos. también nos permite consultar las características hardware de cada nodo mediante el botón "Host Overview", donde veremos el número de cores, memoria y otros parámetros.
La sencillez de ganglia permite de forma rápida comprobar si nuestro trabajo está ocupando realmente los elementos del cluster, o bien si el cluster se encuentra muy ocupado antes de lanzar nuestro trabajo para retrasarlo o no.
De forma restrospectiva o forense, podemos seleccionar el rango temporal que queramos para ver el comportamiento del cluster en determinado periodo.
La mejor forma de ver el funcionamiento de ganglia y sus posibilidades es ir pinchando en las diferentes páginas, menús desplegables, etc. Nada de lo que hagamos en ganglia podrá romper ni alterar nada de nuestro cluster, por lo que no hay que tener miedo a experimentar.
Attachments (1)
- gabglia1.png (51.3 KB) - added by tonin 2 years ago.
Download all attachments as: .zip