Les chercheurs développent un outil de référence open supply à précision mixte pour les supercalculateurs

Les membres du groupe de méthodes et d’analyses d’IA à grande échelle du Centre nationwide des sciences informatiques de l’ORNL ont développé l’outil d’analyse comparative à précision mixte OpenMxP. De gauche à droite : le chef du groupe Fei Wang, le responsable methodology Mike Matheson et le chercheur Hao Lu. Supply : Carlos Jones/ORNL, Département américain de l’énergie

Alors que Frontier, le premier supercalculateur exascale au monde, a été assemblé au Oak Ridge Management Computing Facility en 2021, comprendre ses performances dans les calculs de précision mixte restait un défi. Cette lacune dans l. a. compréhension n’était pas un oubli, mais plutôt un signe de l. a. façon dont les nouveaux systèmes de supercalculateurs qui very good en précision mixte restent dans l. a. science informatique, qui a été dominée par des systèmes axés sur l. a. double précision pendant presque toute son histoire.

L’arithmétique double précision – ou 64 bits – est l. a. principale norme de précision arithmétique dans les simulations. Les calculs de précision mixte (16 ou 32 bits), souvent effectués par des GPU, peuvent fournir les niveaux de précision requis à des vitesses beaucoup plus élevées, en particulier pour l. a. science des données et l’intelligence artificielle. Mais il n’existe pas de logiciel open supply largement disponible pour tester à grande échelle les performances à basse résolution sur les supercalculateurs accélérés par GPU, qui ont été largement déployés pour l. a. première fois en 2012 avec le système Titan d’OLCF.

Ainsi, des chercheurs du laboratoire nationwide d’Oak Ridge du DOE ont développé un nouveau logiciel d’analyse comparative multiplateforme juste à temps pour le lancement de Frontier en mai 2022 : OpenMxP. Ils l’ont également mis à l. a. disposition d’autres installations informatiques sous forme de code open supply.

“Le supercalculateur est une base vitale pour maintenir le management technologique en informatique aux États-Unis, et nous repoussons les limites du supercalculateur – jeu de mots – mais vous ne pouvez pas l’améliorer si vous ne pouvez pas le mesurer, ce qui souligne l’significance de “Cette implémentation de référence d’OpenMxP en tant que norme de capacité bénéficiera à tous les autres systèmes informatiques de pointe”, a déclaré Feiyi Wang. “Cette implémentation de référence d’OpenMxP en tant que norme de capacité bénéficiera à tous les autres systèmes informatiques de pointe”, a déclaré le chef du groupe pour les méthodes d’intelligence artificielle et d’analyse à grande échelle, ou AAIMS, au Nationwide Middle for Computational Science. à l’ORNL.

En raison de son utilité dans l’évaluation et le fonctionnement des supercalculateurs, OpenMxP a récemment été reconnu comme finaliste du prix R&D 100 2023 dans l. a. catégorie Logiciels/Services and products.

Exécutez les chiffres

OpenMxP implémente l. a. tâche d’analyse comparative HPL-MxP, qui a été introduite en 2019 et constitue l. a. norme industrielle pour mesurer l’analyse comparative à précision mixte pour les systèmes de supercalcul. Le HPL-MxP présente un problème à résoudre – un système dense d’équations linéaires – mais pas le logiciel pour le résoudre. C’est aux normes. Auparavant, pour le supercalculateur OLCF Summit, ses fournisseurs de puces GPU développaient et exécutaient des codes spéciaux pour évaluer leur vitesse d’exécution de calculs de précision mixte.

“Dans le passé, les fournisseurs ou les intégrateurs ont toujours géré ce sort de same old. Ils développent leur propre code : c’est leur sauce secrète pour se différencier et offrir leur avantage concurrentiel distinctive. Ils le gèrent et nous prenons leurs résultats “tels quels”. ” Wang a dit.

Ce n’était pas une choice pour Frontier automotive il est alimenté par les CPU et GPU d’AMD, de nouveaux codes de référence devraient donc être développés pour fonctionner correctement sur les puces de nouvelle génération. Lorsque Georgia Taurasi, directrice du NCCS, a soulevé l. a. query de savoir si l’ORNL pouvait gérer elle-même l. a. norme, Wang a suggéré de former une équipe pour le faire. En avril 2021, ils ont commencé à étudier le problème de référence lui-même et à consulter des chercheurs ayant travaillé sur des problèmes similaires.

“Nous n’avions aucune expérience dans l. a. résolution de ce sort de problèmes, nous avons donc rencontré des problèmes avec des progiciels que nous n’avions pas anticipés. Vous vous attendez simplement à ce qu’une interface de transmission de messages fonctionne comme vous pensez qu’elle fonctionnera dans votre tête. “Nous n’avions aucune expérience dans l. a. résolution de ce sort de problèmes. expérience avec”, a déclaré Mike Matheson, directeur methodology du projet OpenMxP au sein du groupe AAIMS. Mais cela n’a pas fonctionné de cette façon. ” “Donc, nous essayions des choses, et puis ça ne marchait pas, et puis nous Nous parlions à d’autres personnes, puis nous essayions autre selected. Nous explorions en quelque sorte l’avenir, essayant de comprendre ce qui fonctionnait vraiment. « C’était une courbe d’apprentissage, et nous devions simplement le faire. »

Heureusement, le projet Frontier était encore à plusieurs mois d’être achevé. Malheureusement, cela signifie également qu’ils développeront du code pour un appareil sur lequel ils n’ont pas encore pu le tester. Mais une fois qu’OpenMxP était prêt pour le déploiement preliminary à l. a. mi-2021, l’équipe disposait d’un autre système très rapide, sinon aussi rapide, à proximité pour servir de banc d’essai.

“Notre objectif était un système Frontier, mais Frontier n’existait pas vraiment à ce moment-là. Nous avons donc profité de ce que nous avions, à savoir le Summit”, a déclaré Wang. “C’était en fait plutôt bien, ce qui signifie qu’une fois que nous avions un système strong pour commencer, que notre code était opérationnel et que nous avions configuré Summit à cette échelle, notre code a été testé au struggle. Nous savions qu’il évoluerait, et le reste était pour l’adapter ou le préparer pour Frontier.

En mai 2022, Frontier était prêt à être lancé. OpenMxP aussi. Le benchmark preliminary de précision mixte de Frontier de 6,86 exaflops – ou 6,86 milliards d’opérations en virgule flottante par seconde – le position en tête de l. a. liste HPL-MxP 2022. Un an plus tard, il a atteint 9,95 exaflops pour reprendre l. a. première position. Le supercalculateur LUMI du projet commun européen de calcul haute efficiency a également utilisé OpenMxP pour soumettre son software HPL-MxP et est arrivé à l. a. deuxième position derrière Frontier dans le classement de juin 2023.

Outil polyvalent

Mettre un numéro dans l. a. compétition n’est pas l. a. véritable pressure d’OpenMxP. Le progiciel fournit finalement un aperçu des performances des supercalculateurs GPU/CPU, contribuant ainsi à améliorer leurs performances en révélant remark de petits changements dans l. a. programmation peuvent conduire à des augmentations de vitesse de calcul. Grâce aux résultats rapides et puissants qu’il révèle, OpenMxP peut également démontrer aux informaticiens les avantages de l’utilisation de systèmes équipés de GPU capables d’effectuer des calculs de précision mixte.

“Beaucoup de simulations résolvent de grands systèmes d’équations, et généralement toutes ne sont qu’une double précision, où les chercheurs prennent un marteau et suivent le chemin qu’ils connaissent”, a déclaré Matheson. appareils à utilization spécial. » . . “Mais avec l’avènement de tous les GPU effectuant des calculs de faible précision plus rapidement que les CPU, cela a permis à ce nouveau processus de resolution d’être attrayant.”

De plus, OpenMxP peut servir d’outil pour résoudre certains problèmes scientifiques et tactics avec des vitesses et une efficacité énergétique sans précédent. Le problème HPL-MxP same old résolu par OpenMxP se compose de grands systèmes d’équations linéaires, qui sont également les éléments constitutifs des packages scientifiques et tactics.

En 2022, l’équipe ORNL – comprenant les chercheurs du NCCS Wang, Matheson, Hao Lu et Jens Glaser – a utilisé OpenMxP comme resolution pour TwoFold, une suite logicielle qui prédit l. a. pressure avec laquelle une molécule médicamenteuse donnée se liera aux brokers pathogènes et qui prédit l’effet three-D. effet. Los angeles construction de l. a. façon dont il est attaché à l. a. cible. TwoFold a été nommé finaliste du prix spécial Gordon Bell 2022 pour l. a. recherche HPC sur le COVID-19 par l’Affiliation for Computing Equipment.

“Los angeles véritable selected que nous essayons de faire est de faire avancer l. a. science en fournissant aux scientifiques un logiciel open supply qu’ils peuvent utiliser et modifier pour résoudre leurs problèmes scientifiques. Et comme nous sommes à une si grande échelle, OpenMxP peut aider à résoudre les plus grands problèmes scientifiques de manière plus rapide”.

Fourni par le Laboratoire nationwide d’Oak Ridge

l. a. quotation: Des chercheurs développent un outil de référence open supply à précision mixte pour les supercalculateurs (25 septembre 2023) Récupéré le 31 octobre 2023 sur

Ce file est soumis au droit d’auteur. Nonobstant toute utilisation équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni à titre informatif uniquement.