1- Accès au cluster :
L'accès au Cluster ALTAIR de l'Université de Tlemcen se fait par une connexion SSH :
• Sous windows: utilisez de préférence putty
• Sous linux: utilisez openssh
Sous Linux la commande de connexion ssh est:
ssh nom_utilisateur@altair.univ-tlemcen.dz
2- Compilation des programmes :
Les compilateurs par défaut sur Altaïr sont les compilateurs d'Intel : icc et ifort.
Vous pouvez compiler vos programmes (fortran ou C) en utilisant les commandes suivantes :
• En fortran : mpiifort votre_programme.for -o votre_executable
• En C : mpiicc votre_programme.c -o votre_executable
Il est hautement recommandé de tester la dépendance de votre exécutable des bibliothèques mathématiques par la commande : ldd votre_executable
3- Soumission de job (taches) :
Le cluster Altaïr utilise l'ordonnanceur slurm .A cet effet, il est recommandé d'écrire un script bash (ou c-shell).
Exemple :
#!/bin/bash
#SBATCH --partition=altair # Nom de la partition : altair
#SBATCH –nodes=5 # Nombre de noeuds utilisés 5
#SBATCH –ntasks-per-node=16 # Nombre de coeurs par neoud : 16 (maximum)
#SBATCH –time=00:10:00 # Temps en Jour-heure:minutes:secondes
#SBATCH –mail-type=END, FAIL # Notification par mail du job
#SBATCH –mail-user=votre_mail # adresse mail de l'utilisateur
#SBATCH –error=altair.%N.%j.err # Sortie standard pour les erreurs
#SBATCH –output=altair.%N.%j.out # Sortie standard des résultats
srun ./Pi_mpi.x
NB: Un job peut être :séquentiel , paramétrique ou parallèle ,pour la documentation , allez sur ce site
4- Exemple :
4.1. Calcul de Pi en utilisant la méthode de Monté Carlo : (voir le code source)
4.2 Compiler le programme par : $ mpiicc -O2 Pi_mpi.c -o Pi_mpi.x
Ecrire un fichier batch pour le lancer dans le cluster :
4.3. Pi_mpi.sh :
#!/bin/bash
#SBATCH --partition=altair
#SBATCH --nodes=2
#SBATCH --ntasks-per-node=16
#SBATCH -J Pi_mpi
#SBATCH –time=0-00:10:00
#SBATCH --mail-type=end
#SBATCH –mail-user=votre_mail@mail.univ-tlemcen.dz
#SBATCH --error=Pi_mpi.err
#SBATCH --output=Pi_mpi.out
srun ./Pi_mpi.x
4.4. Soumettre le script à Slurm :
$ sbatch Pi_mpi.sh
Submitted batch job 5727
Slurm donne un numéro à votre job. Dans cet exemple l'identifiant du job est 5727.
5- Suivi des calculs :
• Pour contrôler ses calculs , il faut exécuter :
squeue -u
• Pour annuler une soumission, il faut identifier l’ID du job avec squeue et exécuter
scancel
• Pour afficher les informations détaillées du job :
scontrol show job jobid -dd
• Pour éstimer le temps probable de démarrage d'un job en attente :
scontrol show job | grep StartTime= ou squeue -o "%S" -j