Changes between Version 1 and Version 2 of dgx_task


Ignore:
Timestamp:
May 20, 2026, 5:10:49 PM (8 days ago)
Author:
i22balur
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • dgx_task

    v1 v2  
    7777  -> GPU 1: Tesla V100-SXM3-32GB (32501 MB)
    7878}}}
     79
     80
     81== Abrir una shell en la DGX ==
     82
     83Por norma general, toda la carga de datos debe hacerse desde al login node copiando los ficheros necesarios al directorio {{{dgx}}}. No obstante, puede haber casos en los que sea necesario abrir una shell para, por ejemplo, compilar software en la DGX o instalar un entorno de conda, para estos casos se puede utilizar el comando {{{srun}}}:
     84
     85{{{
     86srun -p gpu -w averroes-dgx --mem=4GB --cpus-per-task=1 --pty bash
     87}}}
     88
     89Con ello abriremos una shell que tendrá asignada un core y 4 GB de RAM. Nótese como en este caso no reservamos ninguna GPU ya que no vamos a realizar ninguna operación que lo requiera. De hecho, si ahora ejecutásemos el script anterior, nos indicaría que no hay ninguna GPU:
     90
     91{{{#!bash
     92rbarbudo@averroes-dgx:~$ . miniconda3/bin/activate
     93(base) rbarbudo@averroes-dgx:~$ conda activate vllm
     94(vllm) rbarbudo@averroes-dgx:~$ python check_gpus.py
     95--- Verificación de Recursos en DGX ---
     96ID del Trabajo: 832837
     97¡ERROR!: PyTorch no detecta GPUs. Verifica la reserva '--gres=gpu:X'.
     98}}}