| | 79 | |
| | 80 | |
| | 81 | == Abrir una shell en la DGX == |
| | 82 | |
| | 83 | Por norma general, toda la carga de datos debe hacerse desde al login node copiando los ficheros necesarios al directorio {{{dgx}}}. No obstante, puede haber casos en los que sea necesario abrir una shell para, por ejemplo, compilar software en la DGX o instalar un entorno de conda, para estos casos se puede utilizar el comando {{{srun}}}: |
| | 84 | |
| | 85 | {{{ |
| | 86 | srun -p gpu -w averroes-dgx --mem=4GB --cpus-per-task=1 --pty bash |
| | 87 | }}} |
| | 88 | |
| | 89 | Con ello abriremos una shell que tendrá asignada un core y 4 GB de RAM. Nótese como en este caso no reservamos ninguna GPU ya que no vamos a realizar ninguna operación que lo requiera. De hecho, si ahora ejecutásemos el script anterior, nos indicaría que no hay ninguna GPU: |
| | 90 | |
| | 91 | {{{#!bash |
| | 92 | rbarbudo@averroes-dgx:~$ . miniconda3/bin/activate |
| | 93 | (base) rbarbudo@averroes-dgx:~$ conda activate vllm |
| | 94 | (vllm) rbarbudo@averroes-dgx:~$ python check_gpus.py |
| | 95 | --- Verificación de Recursos en DGX --- |
| | 96 | ID del Trabajo: 832837 |
| | 97 | ¡ERROR!: PyTorch no detecta GPUs. Verifica la reserva '--gres=gpu:X'. |
| | 98 | }}} |