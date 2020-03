AMD annonce les architectures de GPU de calcul CDNA et CDNA2.



AMD lors de son événement de la journée des analystes financiers 2020 a dévoilé sa prochaine architecture d'accélérateur de calcul basé sur GPU CDNA. CDNA complétera l'architecture RDNA orientée graphique de l'entreprise. Alors que RDNA alimente les produits graphiques client et entreprise Radeon Pro et Radeon RX de la société, CDNA alimentera les accélérateurs de calcul tels que Radeon Instinct, etc. différenciation de produit.



Les centres de données et les HPC utilisant les accélérateurs Radeon Instinct n'ont aucune utilité pour les capacités réelles de rendu graphique du GPU. Et donc, au niveau du silicium, AMD supprime le matériel graphique raster, les moteurs d'affichage et multimédia, et d'autres composants associés qui autrement occupent des quantités importantes de zone de matrice. À leur place, AMD ajoute du matériel de calcul de tenseur à fonction fixe, similaire aux cœurs de tenseur de certains GPU NVIDIA.







AMD a également parlé de donner à ses GPU de calcul des interfaces de mémoire avancées HBM2e, une interconnexion Infinity Fabric en plus de PCIe, etc. La société a détaillé une brève feuille de route de CDNA à l'horizon 2021-2022. Les accélérateurs de calcul de génération actuelle de la société sont basés sur les architectures "Vega" datées et sont essentiellement des GPU "Vega 20" reconfigurés qui manquent de matériel tensoriel.



Plus tard cette année, la société présentera son premier GPU CDNA basé sur un processus "7 nm", une unité de calcul IPC rivalisant avec RDNA et un matériel tensoriel qui accélère la construction et la formation de l'IA DNN.







Entre 2021 et 2022, AMD présentera son architecture CDNA2 mise à jour basée sur un "processus avancé" qu'AMD n'a pas encore finalisé. La société est assez confiante que la microarchitecture CPU "Zen4" exploitera 5 nm, mais n'a pas été claire à propos de la même chose pour CDNA2 (tous deux lancés à la même époque).



En plus d'augmenter l'IPC, les unités de calcul et d'autres choses, la conception avec CDNA2 sera l'hyper-évolutivité (la capacité de faire évoluer les GPU à travers de vastes pools de mémoire couvrant des milliers de nœuds). AMD exploitera son interconnexion Infinity Fabric de 3e génération et sa mémoire unifiée cohérente en cache pour y parvenir.



Tout comme Compute eXpress Link (CXL) et PCI-Express gen 5.0 d'Intel, Infinity Fabric 3.0 prend en charge les pools de mémoire partagée entre les processeurs et les GPU, permettant une évolutivité du type requis par les superordinateurs exascale tels que le prochain "El Capitan" du US-DoE et "Frontière."



La mémoire unifiée cohérente du cache réduit les transferts de données inutiles entre la mémoire DRAM attachée au CPU et le HBM attaché au GPU. Les cœurs de processeur seront en mesure de traiter directement diverses étapes de calcul en série d'une opération de calcul GPU en parlant directement au HBM connecté au GPU et en ne tirant pas les données vers sa propre mémoire principale.



Cela réduit considérablement les contraintes d'E/S. «El Capitan» est un supercalculateur «tout AMD» avec jusqu'à 2 exaflops (soit 2 000 pétaflops ou 2 millions de TFLOP) de débit de pointe. Il combine les processeurs AMD EPYC "Genoa" basés sur la microarchitecture "Zen4", avec des GPU probablement basés sur CDNA2 et Infinity Fabric 3.0 gérant les E/S.







Côté logiciel, la dernière infrastructure logicielle open source ROCm d'AMD réunira CDNA et CPU, en fournissant un modèle de programmation unifié rivalisant avec OneAPI et NVIDIA CUDA d'Intel. Une API indépendante de la plate-forme compatible avec tout GPU sera combinée avec une couche de traduction CUDA vers HIP.



TECHPOWERUP