Changes between Initial Version and Version 1 of generalidades_colas_hpc


Ignore:
Timestamp:
May 2, 2023, 2:23:23 PM (2 years ago)
Author:
tonin
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • generalidades_colas_hpc

    v1 v1  
     1== Generalidades sobre el sistema de colas slurm ==
     2Como se ha explicado en la descripción del sistema, nuestro sistema HPC consta de una serie de nodos con una capacidad y funcionalidad específica dependiendo del tipo.
     3
     4Dichos nodos de cómputo tienen estas peculiaridades:
     5- Tienen que ser compartidos por varios usuarios.
     6- Tienen unos recursos (cpu/memoria) limitados.
     7- No pueden permitir la conexión directa de usuarios a ellos.
     8
     9Por ello tiene que haber algún sistema que arbitre estos factores disponiendo  de capacidad de autenticación, distribución y uso de los recursos de los nodos. Estos sistemas reciben el nombre de '''gestores de colas'''.
     10
     11La palabra "cola" no implica que el gestor deje aparcado un trabajo enviado hasta que le parezca, tal como ocurría en los primeros tiempos de la informática compartida, donde una persona recepcionaba tarjetas perforadas con datos y programas y las iba colocando en la lectora para procesarse según los criterios establecidos.
     12
     13Si los usuarios están bien formados y entrenados en el uso del gestor de colas, es muy posible que casi el 100% de los trabajos mandados a la cola se ejecuten inmediatamente. Por el contrario si los usuarios no están formados y no saben calibrar sus necesidades computacionales, habrá nodos reservados cuando aún tendrían capacidad de absorber más trabajos.
     14
     15Por todo ello es imprescindible que lea atentamente y entienda las instrucciones de toda esta sección, en beneficio propio y de los demás usuarios.
     16
     17