25-05-2016

Manuel d'utilisation

 

1- Accès au cluster :

L'accès au Cluster ALTAIR de l'Université de Tlemcen se fait par une connexion SSH :
• Sous windows: utilisez de préférence putty
• Sous linux: utilisez openssh

Sous Linux la commande de connexion ssh est:
ssh nom_utilisateur@altair.univ-tlemcen.dz   

2- Compilation des programmes :

Les compilateurs par défaut sur Altaïr sont les compilateurs d'Intel : icc et ifort.
Vous pouvez compiler vos programmes (fortran ou C) en utilisant les commandes suivantes :
• En fortran : mpiifort votre_programme.for -o votre_executable
• En C : mpiicc votre_programme.c -o votre_executable
Il est hautement recommandé de tester la dépendance de votre exécutable des bibliothèques mathématiques par la commande : ldd votre_executable

3- Soumission de job (taches) :

Le cluster Altaïr utilise l'ordonnanceur slurm .A cet effet, il est recommandé d'écrire un script bash (ou c-shell).

Exemple :
#!/bin/bash
#SBATCH --partition=altair # Nom de la partition : altair
#SBATCH –nodes=5 # Nombre de noeuds utilisés 5
#SBATCH –ntasks-per-node=16 # Nombre de coeurs par neoud : 16 (maximum)
#SBATCH –time=00:10:00 # Temps en Jour-heure:minutes:secondes
#SBATCH –mail-type=END, FAIL # Notification par mail du job
#SBATCH –mail-user=votre_mail # adresse mail de l'utilisateur
#SBATCH –error=altair.%N.%j.err # Sortie standard pour les erreurs
#SBATCH –output=altair.%N.%j.out # Sortie standard des résultats
srun ./Pi_mpi.x

NB: Un job peut être  :séquentiel , paramétrique ou parallèle  ,pour la documentation , allez sur ce site

4- Exemple :

4.1. Calcul de Pi en utilisant la méthode de Monté Carlo : (voir le code source)

4.2  Compiler le programme par : $ mpiicc -O2 Pi_mpi.c -o Pi_mpi.x
Ecrire un fichier batch pour le lancer dans le cluster :

4.3. Pi_mpi.sh :

#!/bin/bash
#SBATCH --partition=altair
#SBATCH --nodes=2
#SBATCH --ntasks-per-node=16
#SBATCH -J Pi_mpi
#SBATCH –time=0-00:10:00
#SBATCH --mail-type=end
#SBATCH –mail-user=votre_mail@mail.univ-tlemcen.dz
#SBATCH --error=Pi_mpi.err
#SBATCH --output=Pi_mpi.out
srun ./Pi_mpi.x

4.4. Soumettre le script à Slurm :

$ sbatch Pi_mpi.sh
Submitted batch job 5727
Slurm donne un numéro à votre job. Dans cet exemple l'identifiant du job est 5727.

5- Suivi des calculs :

• Pour contrôler ses calculs , il faut exécuter :    
  squeue -u
• Pour annuler une soumission, il faut identifier l’ID du job avec squeue et exécuter
  scancel
• Pour afficher les informations détaillées du job :
  scontrol show job jobid -dd
• Pour éstimer le temps probable de démarrage d'un job  en attente :     
  scontrol show job | grep StartTime=  ou  squeue   -o "%S"  -j