28-01-2016

HPC

 

HPC : High Performance Computing

Le calcul intensif ou calcul haute performance (HPC : High Performance Computing) est un ensemble de techniques et des moyens ( Ordinateurs, logiciels et expertise) destinés à traiter des applications complexes (simulation, conception et calcul scientifique, ...) en faisant appel à des ordinateurs spécialisés dans le traitement rapide de gros volumes de données numériques.

Les domaines d’application du calcul intensif sont nombreux, sa maitrise et son utilisation sont devenus incontournables. Il est devenu un outil indispensable aussi bien pour les chercheurs que les industriels et pratiquement dans toutes les disciplines. On le retrouve dans différents domaines : les hydrocarbures (modélisation des réservoirs, sismographie, et du raffinage à la distribution), les applications industrielles (mécanique des fluides, chaines de montage, réduction des poids des véhicules, avions, conception et validation de voitures,...), création de monde virtuel (jeux, médecine) résolution des équations (différentielles, aux dérivées partielles, ...), Chimie quantique, Astrophysique, Modélisation du climat, Météo, La vie quotidienne (prévision de comportement du client dans les supermarchés : exemple corrélation d’un produit A avec un autre produit B), etc.

Incontournables aussi bien dans le domaine de la recherche que dans celui de l'industrie, la modélisation et la simulation sur ordinateur ont pour objet de créer une représentation virtuelle d’un objet, d’un phénomène ou d’un concept afin de l’analyser et de le comprendre, de façon à pouvoir prévoir son comportement, voire le contrôler. Modélisation et simulation se sont introduites naturellement entre théorie et expérience, qui sont au coeur de la démarche scientifique. Elles constituent désormais un moyen privilégié d’investigation pour les chercheurs. Elles sont devenues une condition nécessaire du progrès scientifique dans des domaines aussi variés que la climatologie, la chimie quantique, la biologie, la fusion contrôlée ou les nanotechnologies.

En outre, dans certains domaines, la nature même de la connaissance scientifique a évolué au cours des dernières décennies, en raison de l’étude de systèmes et de phénomènes complexes. Elle repose désormais sur la gestion et l'utilisation d’une masse d’information qu’il faut systématiser, recueillir, distribuer et exploiter. La biologie génomique et post-génomique, qui met en jeu des volumes d'informations toujours plus importants, constitue l’exemple le plus frappant de cette évolution.

Les enjeux économiques de la modélisation et de la numérisation sur ordinateur dépassent de beaucoup la mise à disposition des chercheurs d'outils particulièrement performants. D’une part la capacité d'un état à effectuer des modélisations et des simulations sur ordinateur est devenue un élément essentiel de sa crédibilité aussi bien dans le domaine de la défense (nucléaire) que dans celui de la préservation de l’environnement (climatologie). D’autre part, le niveau de compréhension et de caractérisation des systèmes complexes autorisé par la simulation numérique permet de réduire les risques, partant les coûts de développement, des grands programmes et d'optimiser les investissements industriels, dans les secteurs de pointe (microélectronique, nanotechnologies, sécurité des installations). La puissance de calcul dont dispose un pays est ainsi devenue un facteur essentiel à sa crédibilité sur la scène internationale, au succès de sa politique de recherche et un levier important pour sa compétitivité industrielle.

La mise en oeuvre de ces techniques nécessite le recours à des calculateurs particulièrement puissants que leurs performances situent bien au-delà de celles des produits catalogue des constructeurs d'ordinateurs. C'est pourquoi on parle à leur propos de calcul intensif ou de calcul de haute performance (High Performance Computing ou HPC, en anglais).

La nécessité d'affiner sans cesse les modèles pour de meilleures prévisions (météorologie) ou d'étendre leur application dans le temps (océanographie) ou dans l'espace (nombre de molécules prises en compte dans une réaction chimique) conjuguée au progrès technologique conduit à améliorer sans cesse les performances des calculateurs. C'est ainsi que de nombreuses simulations numériques recourent à la technique du maillage qui consiste à découper l'objet étudié (l'atmosphère terrestre, un avion, etc.) en petits volumes élémentaires, les mailles. Augmenter la précision de la simulation signifie réduire la taille des mailles. Mais, si on divise celle-ci par 10, on multiplie le nombre de mailles par 1 000 (103). Or la puissance de calcul nécessaire évolue au moins dans les mêmes l’algorithmique et du calcul.

Cette tendance conduit à l’utilisation d’ordinateurs de plus en plus puissants. Elle demande aussi un grand savoir-faire de la part des chercheurs qui doivent développer les programmes correspondants (les codes), suffisamment parallélisés pour exploiter au mieux ces machines. Celles-ci exigent une grande fiabilité pour pouvoir fonctionner sans faute pendant des centaines d'heures, voire des milliers dans certains cas extrêmes.

HPC High Performance Computing et Industrie

Le calcul de haute performance est aujourd'hui largement utilisé dans l'industrie. Pour ne prendre qu'un exemple, mais on pourrait les multiplier dans les domaines de l'automobile, du pétrole ou des systèmes d'armes, les avionneurs utilisent déjà couramment des méthodes de calculs approchés pour améliorer le dessin de l’avion. Le nombre de maquettes testées par Boeing a ainsi été divisé par dix entre deux générations d’avions. Des méthodes approchées, comme la simulation des grandes échelles de la turbulence dans le domaine des moteurs, peuvent, de plus, donner des résultats intéressants avec une machine de 100 teraflops.

Il faut sensibiliser les grands industriels algériens à l’utilisation de calcul intensif. Le fait de savoir qu’un industriel procède à des calculs sur un domaine ou un ensemble de domaines est déjà en soi une information qui relève de l’intelligence économique.

Par ailleurs, la brièveté de la durée de vie des machines utilisées pour le calcul scientifique (typiquement moins de cinq ans) induit des coûts de portage récurrents et élevés pour les industriels.

Pour toutes ces raisons, la DGRSDT , mettra à la disposition des industriels ces moyens propres de calcul et un accès facile à un réseau d’experts qui puisse les éclairer dans leurs choix de logiciels et de machines.

Cette vue d’ensemble suggère d’une part de promouvoir la simulation numérique de manière large pour qu’elle puisse être reprise en interne par les entreprises, d’autre part de promouvoir la coopération entre le monde de la recherche académique et celui de la R & D industrielle autour des modèles avancés.

En revanche, il faut éviter le travers de rendre la croissance des centres de calcul intensif destinés à la recherche publique dépendante de la clientèle industrielle. En effet une fois son projet mûr, une entreprise aura une tendance affirmée à internaliser l’exploitation informatique correspondante en son sein, en l'accompagnant éventuellement d’un déploiement au plan mondial calquée sur sa structure globale.

Plusieurs arguments militent pour que, sans pratiquer systématiquement la course à la puissance, l’Algérie reste bien classée dans la communauté Africaine et mondiale du calcul scientifique :

  • la concurrence internationale est particulièrement vive dans le domaine de la recherche
  • Derrière cette concurrence se cachent des enjeux de pouvoir: des négociations internationales de grande envergure comme celle du protocole de Kyoto s'appuient sur les résultats de modélisations que les scientifiques mettent à la disposition des politiques ; peut on imaginer un seul instant que les négociateurs internationaux s'en remettent entièrement à des données fournies par des experts américains ou japonais ? Il est donc essentiel, sinon pour l’Algérie, de garder une capacité autonome d'expertise, voire de contre-expertise, dans les domaines nécessitant de grands calculs (climatologie, nucléaire civil, biologie, nanotechnologies, ...).
  • les progrès en théorie et en description des systèmes complexes suivent dans une large mesure ceux des ordinateurs ; ne pas mettre à disposition des chercheurs les outils le plus en pointe revient à les handicaper durablement dans la compétition internationale.
  • le maintien d'équipes de classe internationale dans le domaine du calcul scientifique, aussi bien en matériel qu'en logiciel, n'est possible que si celles-ci peuvent se regrouper autour de machines qui figurent dans les dix ou vingt premières du TOP 500.
  • enfin, la puissance de calcul reste toujours à la base du poids de chaque partenaire dans un accord international ; si donc on ne veut pas laisser marginaliser les futurs centres de calcul Algériens face à leurs homologues du monde, il faut les équiper en conséquence.

 

Si l’Algérie veut compter parmi les principaux foyers mondiaux de recherche, elle doit impérativement, dans le domaine du calcul intensif, réformer son système pour mieux coordonner ses efforts au niveau national, développer la prospective et y consacrer des moyens financiers réguliers, étant précisé que les considérations de politique industrielle ne rentraient pas dans le cadre de cette mission.

Source : DGRSDT Direction Générale de la Recherche Scientifique et du Développement Technologique