10º Curso Introductorio Usuarios NLHPC

Fecha: 31 de marzo 2022
Hora de inicio: 09:00 hrs.

Formación

En el marco de los cursos que estamos realizando para capacitar a nuestros usuarios actuales, así como a nuestros potenciales usuarios (véase este enlace para más información), hemos realizado nuestra décima sesión de cursos introductorios al uso de nuestra infraestructura. El curso fue dictado a través de la plataforma de streaming Zoom el día Jueves 31 de Marzo de 09:00 a 13:00 (hora chilena).

Usar un supercomputador es distinto a usar un computador normal, hay que tener en cuenta que su acceso es compartido por cientos de usuarios, por lo que hay que establecer unas políticas de uso y un mecanismo para compartir los recursos.

En este taller se mostró como usar el sistema gestor de recursos (Slurm) que tenemos instalado en el supercomputador Guacolda-Leftraru del Laboratorio Nacional de Computación de Alto Rendimiento, mostrando algunos consejos muy útiles para su correcto uso. Los contenidos revisados fueron los siguientes:

  • Accediendo al cluster:
    • Acceso vía SSH
    • Recursos e Infraestructura disponible
  • Gestor de recursos Slurm
    • Qué es Slurm
    • Parámetros utilizados
    • Uso interactivo con srun
    • Envío de tareas mediante sbatch
      • Script básicos
      • Encolar.
    • Información y monitoreo de tareas
      • Uso de comandos squeue y scontrol
      • Acceso a nodos con tareas en ejecución
      • Cancelación de tareas
      • Subutilización de recursos.
      • Otras tareas
  • Sistema de módulos y Software
    • Listado y búsqueda de software
    • Uso del software disponible.
  • Escalamiento de Aplicaciones.

Para poder seguir el curso y los comandos realizados, se recomienda tener conocimientos de Linux.

Les sugerimos descargar y tener accesible los ejercicios que fueron resueltos durante el taller.

En esta ocasión tuvimos un total de 24 participantes en el curso.

A continuación dejamos el registro del curso: