Changes between Initial Version and Version 1 of comandos_básicos_slurm


Ignore:
Timestamp:
May 3, 2023, 8:53:23 AM (2 years ago)
Author:
tonin
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • comandos_básicos_slurm

    v1 v1  
     1== Comandos básicos de slurm ==
     2Los comandos de slurm que usará con más asiduidad son realmente muy pocos, principalmente:
     3- '''sinfo:''' Le mostrará información sobre el estado de las particiones y nodos de slurm, con una salida como esta:
     4{{{
     5[root@admin01 etc]# sinfo
     6PARTITION AVAIL  TIMELIMIT  NODES  STATE NODELIST
     7normal*      up   infinite      5  down* x440-[20-24]
     8normal*      up   infinite     19   idle x440-[01-19]
     9fat          up   infinite      1   idle x808
     10}}}
     11 En ella puede ver que existen dos particiones (normal y fat), que la partición {{{normal}}} consta de 24 nodos de los cuales 5 están caidos y 19 en estado de espera para recibir trabajos. También hay una partición llamada {{{fat}}} con un solo nodo en estado de espera.
     12 Si un usuario envía un trabajo que tiene 140 procesos que ocupan un solo core, y teniendo en cuenta que los nodos de la partición normal disponen de 40 cores, la salida de sinfo durante la ejecución será esta:
     13{{{
     14[root@admin01 etc]# sinfo
     15PARTITION AVAIL  TIMELIMIT  NODES  STATE NODELIST
     16normal*      up   infinite      5  down* x440-[20-24]
     17normal*      up   infinite      1    mix x440-04
     18normal*      up   infinite      3  alloc x440-[01-03]
     19normal*      up   infinite     15   idle x440-[05-19]
     20fat          up   infinite      1   idle x808
     21}}}
     22 Como se puede ver hay 3 nodos (del x440-01 al x440-03) totalmente asignados y el nodo x440-04 en estado {{{mix}}} que indica que aún ejecutando procesos tiene recursos libres para ejecutar más. El resto de nodos se encuentran en el mismo estado que en el ejemplo anterior.
     23