| 1 | == Generalidades sobre el sistema de colas slurm == |
| 2 | Como se ha explicado en la descripción del sistema, nuestro sistema HPC consta de una serie de nodos con una capacidad y funcionalidad específica dependiendo del tipo. |
| 3 | |
| 4 | Dichos nodos de cómputo tienen estas peculiaridades: |
| 5 | - Tienen que ser compartidos por varios usuarios. |
| 6 | - Tienen unos recursos (cpu/memoria) limitados. |
| 7 | - No pueden permitir la conexión directa de usuarios a ellos. |
| 8 | |
| 9 | Por ello tiene que haber algún sistema que arbitre estos factores disponiendo de capacidad de autenticación, distribución y uso de los recursos de los nodos. Estos sistemas reciben el nombre de '''gestores de colas'''. |
| 10 | |
| 11 | La palabra "cola" no implica que el gestor deje aparcado un trabajo enviado hasta que le parezca, tal como ocurría en los primeros tiempos de la informática compartida, donde una persona recepcionaba tarjetas perforadas con datos y programas y las iba colocando en la lectora para procesarse según los criterios establecidos. |
| 12 | |
| 13 | Si los usuarios están bien formados y entrenados en el uso del gestor de colas, es muy posible que casi el 100% de los trabajos mandados a la cola se ejecuten inmediatamente. Por el contrario si los usuarios no están formados y no saben calibrar sus necesidades computacionales, habrá nodos reservados cuando aún tendrían capacidad de absorber más trabajos. |
| 14 | |
| 15 | Por todo ello es imprescindible que lea atentamente y entienda las instrucciones de toda esta sección, en beneficio propio y de los demás usuarios. |
| 16 | |
| 17 | |