Solveurs optimisés par processeur graphique pour la physique de la diffusion


Développés par des chercheurs du LLNL et de la Portland State University, des solveurs innovants sans matrice offrent des gains de performances pour les simulations multiphysiques complexes. Crédit : Amanda Levasseur

À la base de toutes les simulations multiphysiques complexes se trouvent des algorithmes mathématiques encore plus complexes qui résolvent les équations décrivant le mouvement des phénomènes physiques, par exemple la diffusion du rayonnement et les processus de combustion du plasma inhérents aux réactions de fusion. Des solveurs préconditionnés sont souvent utilisés dans ces algorithmes pour transformer un problème afin qu’il converge rapidement et précisément vers une solution.

Un article récent dans SIAM Journal sur le calcul scientifique présente des solveurs spécialisés optimisés pour les simulations exécutées sur des supercalculateurs basés sur des unités de traitement graphique (GPU). Les auteurs sont le mathématicien informatique Tzanio Kolev du Centre de calcul scientifique appliqué du LLNL, aux côtés de Will Pazner et Panayot Vassilevski, tous deux anciens chercheurs de Livermore, aujourd’hui à l’Université d’État de Portland.

Les algorithmes de l’équipe résolvent les équations de diffusion du rayonnement qui sous-tendent MARBL, un code hydrodynamique essentiel à la mission qui fonctionne désormais sur des GPU comme ceux du prochain supercalculateur exascale de Livermore, El Capitan.

“Le modèle de diffusion de rayonnement de MARBL nécessite un type spécifique de solveur afin d’obtenir l’efficacité du GPU. Nos algorithmes sont optimisés pour ce scénario”, a déclaré Pazner, l’auteur principal de l’article.

Décomposer les mathématiques

Pour un calcul plus rapide, ces solveurs subdivisent les systèmes physiques en un espace d’éléments finis appelé H(div). Ce type de discrétisation augmente le nombre d’éléments finis tout en diminuant leur taille (pensez à un maillage 3D se décomposant en carrés de plus en plus petits tout en conservant un volume global constant).

H(div) est l’un des quatre espaces d’éléments finis dans un ensemble d’équations différentielles connu sous le nom de complexe de Rham, qui sont toutes incorporées dans la bibliothèque logicielle MFEM (Modular Finite Element Methods) dirigée par Livermore.

“Tout au long de nos recherches, nous avions développé des solveurs efficaces pour les autres espaces, mais nous n’avions pas encore trouvé la meilleure façon d’aborder H(div). Nous savions que nous pouvions faire mieux”, a déclaré Koley.

De nombreux éléments finis sont calculés avec des matrices dans lesquelles les nombres sont disposés en lignes et en colonnes. Mais lorsqu’une matrice est trop grande pour être calculée efficacement (comme dans les simulations hydrodynamiques à grande échelle), les algorithmes sans matrice constituent la seule voie possible.

« Les problèmes d’ordre élevé deviennent prohibitifs à exécuter sur des GPU, non seulement en raison de la taille à calculer mais aussi du transfert de mémoire. Les algorithmes basés sur la matrice provoquent souvent des goulots d’étranglement de mémoire sur les GPU, nous avons donc dû proposer des algorithmes qui arrivent au niveau le plus élevé. même solution tout en évitant le traitement et le stockage de la matrice”, a déclaré Pazner.






Bien qu’armée de solveurs de Rham sans matrice, il manquait encore à l’équipe quelque chose pour alléger la charge de calcul de H(div). Le tournant a été leur décision de reformuler le problème dans le contexte d’un système de points-selles, dont les surfaces ressemblent à une selle d’équitation lorsqu’elles sont tracées sur un graphique. Essentiellement, ils ont transformé le problème initial en deux problèmes couplés avec une structure mathématique différente.

La technique de la pointe en selle peut sembler contre-intuitive, mais à mesure que les chercheurs ont essayé d’autres techniques, celle-ci a fini par atteindre le sommet.

“La reformulation du problème dans une formulation de point de selle élargit la formulation originale condensée et étroitement emballée”, a déclaré Pazner. “La structure devient plus grande mais aussi beaucoup plus susceptible d’être résolue.”

Les solveurs H(div) innovants de l’équipe combinent efficacement toutes les approches ci-dessus. “L’examen du problème sous forme de points de selle nous a permis de tirer parti de la structure sans matrice de manière favorable”, a déclaré Kolev, attribuant cette avancée à ses co-auteurs.

“H(div) était le dernier outil de la boîte à outils de de Rham pour nos utilisateurs. Nous réfléchissions à ce problème depuis longtemps et nous disposons désormais de méthodes de pointe dans tous les espaces de Rham. “

Des CPU aux GPU

Comme le démontrent des années de recherche sur le calcul haute performance (HPC) du LLNL, la portabilité des unités centrales de traitement (CPU) vers les GPU constitue le principal défi de l’évolutivité d’une application d’un type d’architecture HPC à un autre. Dans ce contexte, des mathématiques plus rapides conduisent à une physique plus rapide.

“Les systèmes HPC de nouvelle génération promettent d’énormes accélérations, mais ces avantages ne se concrétisent que si les solveurs sont optimisés pour le matériel moderne”, a déclaré Pazner.

“Les GPU ont tout changé. Les problèmes que vous pensiez savoir résoudre sont soudainement redevenus intéressants”, a déclaré Kolev.

L’équipe a testé ses solveurs optimisés sur des problèmes d’analyse comparative de diffusion de rayonnement à l’aide des supercalculateurs Quartz basés sur CPU de Livermore et des supercalculateurs hybrides CPU/GPU Lassen, ce qui a permis d’obtenir des accélérations significatives avec moins de ressources de calcul. Par exemple, les applications qui nécessitent plus de nœuds et des temps d’exécution plus longs sur Quartz peuvent s’exécuter en quelques secondes seulement sur un seul nœud Lassen. Cette augmentation de productivité est cruciale car des codes comme MARBL sont portés sur El Capitan.

“Ces nouveaux préconditionneurs ont permis des performances évolutives sur les architectures CPU et GPU pour une classe importante de solveurs physiques basés sur la diffusion, qui constituent un composant essentiel de nos codes de simulation multiphysique”, a déclaré Rob Rieben, responsable du projet MARBL. “Grâce à ces méthodes avancées, nous pouvons obtenir des performances dans des simulations importantes, notamment la fusion par confinement inertiel.”

Plus d’information:
Will Pazner et al, Solveurs de points de selle hautes performances sans matrice pour les problèmes d’ordre élevé dans \(\boldsymbol{H}(\operatorname{\textbf{div}})\), SIAM Journal sur le calcul scientifique (2024). DOI : 10.1137/23M1568806

Fourni par le Laboratoire national Lawrence Livermore

Citation: Matrice déchargée : solveurs améliorés par le processeur graphique pour la physique de la diffusion (25 juin 2024) récupéré le 25 juin 2024 sur

Ce document est soumis au droit d’auteur. En dehors de toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni seulement pour information.



Related posts

L’analyse révèle que la plupart des LLM majeurs en open source et en source fermée ont tendance à pencher à gauche lorsqu’on leur pose des questions à forte connotation politique

Une étude examine la contagion du suicide après le décès de célébrités, ouvrant des pistes de prévention

Sonder la capture du carbone, atome par atome, avec un modèle d’apprentissage automatique