Changes between Version 1 and Version 2 of comandos_básicos_slurm


Ignore:
Timestamp:
May 3, 2023, 9:10:03 AM (2 years ago)
Author:
tonin
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • comandos_básicos_slurm

    v1 v2  
    2222 Como se puede ver hay 3 nodos (del x440-01 al x440-03) totalmente asignados y el nodo x440-04 en estado {{{mix}}} que indica que aún ejecutando procesos tiene recursos libres para ejecutar más. El resto de nodos se encuentran en el mismo estado que en el ejemplo anterior.
    2323
     24- '''sbatch:''' Encola un script slurm. Es el comando básico para enviar trabajos a la cola y su uso es tan simple como teclear {{{sbatch mi_fichero.slurm}}}, realmente las instrucciones y opciones estarán en el fichero {{{.slurm}}}. Si el lanzamiento es correcto, nos devuelve el identificador de nuestro trabajo que es importante para otras operaciones.
     25{{{
     26(base) [tonin@admin01 slurm-tests]$ sbatch h7.slurm
     27Submitted batch job 5351
     28}}}
     29
     30- '''scancel:''' Cancela un trabajo de la cola. Lógicamente un usuario normal solo puede cancelar los trabajos que haya mandado él mismo. La sintaxis es {{{scancel job-id}}} donde job-id es precisamente el número que nos devolvió el comando {{{sbatch}}} al lanzarlo previamente. La cancelación de un trabajo implica no solo que salgan de la cola de slurm aquellos procesos que no se hayan iniciado áun, sino que también termina todos los procesos en ejecución relativos a la tarea.
     31
     32- '''squeue:''' Consulta el estado de la cola de slurm. Si se invoca sin ningún argumento muestra todos los procesos de la cola. Es importante tener en cuenta que squeue muestra procesos y no trabajos, luego si un trabajo consta de 100 procesos, nos aparecerán las 100 líneas. La salida para un trabajo que conste de 10 procesos podría ser como esta:
     33{{{
     34(base) [tonin@admin01 slurm-tests]$ squeue
     35             JOBID PARTITION     NAME     USER ST       TIME  NODES NODELIST(REASON)
     36            5641_1    normal    hello    tonin  R       0:03      1 x440-01
     37            5641_2    normal    hello    tonin  R       0:03      1 x440-01
     38            5641_3    normal    hello    tonin  R       0:03      1 x440-01
     39            5641_4    normal    hello    tonin  R       0:03      1 x440-01
     40            5641_5    normal    hello    tonin  R       0:03      1 x440-01
     41            5641_6    normal    hello    tonin  R       0:03      1 x440-01
     42            5641_7    normal    hello    tonin  R       0:03      1 x440-01
     43            5641_8    normal    hello    tonin  R       0:03      1 x440-01
     44            5641_9    normal    hello    tonin  R       0:03      1 x440-01
     45           5641_10    normal    hello    tonin  R       0:03      1 x440-01
     46}}}
     47