AMD annonce les Radeon Instinct MI60 & MI50, des GPU Vega 20 gravés en 7 nm,

Embarquant jusqu'à 32 Go HBM2 et optimisés pour le Deep Learning

Le 2018-11-07 15:00:55, par Christian Olivier, Expert éminent sénior

À l’occasion de sa conférence Next Horizon qui s’est tenue hier à San Francisco, la société Advanced Micro Devices (AMD) a levé le voile sur sa nouvelle architecture pour processeurs x86 baptisée Zen 2 qui va succéder à Zen+. Les processeurs qui bénéficieront en premier de cette nouvelle architecture devraient faire leur apparition dès l’an prochain dans la nouvelle génération de CPU AMD dédiée aux serveurs et aux stations de travail, des processeurs qui portent le nom de code Rome et succèderont aux CPU EPYC basés sur Zen.

La firme de SunnyVale en a également profité pour dévoiler ses GPU Radeon Instinct MI60 & MI50, des GPU basés sur le circuit graphique Vega 20 exploitant le procédé de gravure en 7 nm de TSMC. Ils embarquent jusqu’à 32 Go de mémoire HBM2 ECC, avec une bande passante maximale de 1 To/s et jusqu’à 13,2 milliards de transistors.

Les nouveaux circuits graphiques Pro d’AMD exploitent la même architecture que les premiers GPU Vega gravés en 14 nm en profitant d’une meilleure finesse de gravure et des optimisations spécifiques au HPC. Ils intègrent notamment des jeux d’instructions pour le Deep Learnig (DL) et le Machine Learning (ML). Ils sont entièrement compatibles avec le logiciel ROCM d’AMD et exploitent un nouveau moteur pour le ML.

Ces nouveaux GPU Radeon Instinct MI60 & MI50 sont, par ailleurs, compatibles avec les technologies VDI (Virtual Desktop Infrastructure), DaaS (Desktop-as-a-Service), MxGPU (basée sur le standard SR-IOV ou Single Root I/O Virtualization) et les environnements Cloud.

Le GPU Vega 20 avec ses 64 unités de calcul et ses 4096 stream processors embarque 13,23 milliards de transistors disposés sur une matrice de 331 mm². Cette puce optimisée pour le HPC fonctionne à des fréquences d’horloge plus élevées, ce qui lui permet d’atteindre 7,4 TFLOPs en double précision, 14,8 TFLOPs en simple précision et 29,5 TFLOPs en demi-précision.

Elle autorise des transferts de données jusqu’à 6 fois plus rapides qu’avec une liaison PCIe 3.0 unique grâce à deux liaisons Infinity Fabric Links par GPU qui fournissent jusqu’à 200 Go/s de bande passante peer-to-peer et permettent la connexion de jusqu’à 4 GPU dans une configuration en anneau.

Le GPU Radeon Instinct MI60, la version complète du Vega 20, prend désormais en charge les types INT8 et INT4 avec une puissance de calcul théorique maximale de 118 TFLOPs en INT4 et 59 TFLOPs en INT8. Il devrait être mis sur le marché avant la fin de l’année, ce qui en fera par la même occasion la première carte graphique gravée en 7 nm du marché.

Le GPU Radeon Instinct MI50 est une variante légèrement bridée du MI60, avec 3840 cœurs actifs (au lieu de 4096), 16 Go HBM2 (au lieu de 32 Go) et des capacités de calcul légèrement inférieures, mais à un prix plus abordable. Les deux cartes auront deux connecteurs 8 broches et le MI60 devrait afficher un TDP de 300 W.

AMD a également partagé une feuille de route qui montre qu’un nouveau produit Radeon Instinct, portant le nom de code « ;MI-Next ;» sera lancé l’année prochaine. Il devrait offrir de meilleures performances, une connectivité accrue et une meilleure compatibilité logicielle.

Source : WccfTech, AnandTech

Et vous ?

Qu’en pensez-vous ?

Voir aussi

Canalys : AMD va détrôner Intel en termes de performance l'année prochain, bientôt la fin de l'hégémonie d'Intel ?

AMD lance son Threadripper 2990WX, le CPU de bureau le plus puissant au monde, capable de monter jusqu'à 6 GHz avec ses 32 cœurs/64 threads actifs

Computex 2018 : AMD présente ses GPU VEGA Radeon Instinct gravés en 7 nm pour l'IA et officialise sa RX VEGA 56 Nano pour les PC de jeux

AMD prépare la révolution des pucettes : de très petites puces que l'on pourrait assembler dans un même boîtier pour former un processeur complet

Discussion forum

3 commentaires

darkman19320
Membre éclairé

Ces cartes graphiques semblent très bien sur le papier.

Par contre je me pose une question suite au fait qu'elles soient optimisées pour le Deep Learning: qui utilise ROCM?
Parce qu'à ma connaissance, Tensorflow, Caffe and Co ne supporte pas (encore?) officiellement OpenCL/SYCL.

Quelqu'un à des retours sur la question?

Merci

le 08/11/2018 à 10:27
Steinvikel
Membre expert

J'ai cru comprendre que le deep learnig à la cotte côté marketing /communication, mais est-ce qu'il en ai autant sur l'achat dans les milieu type server ? aucune idée, je ne m'y connais pas.
En revanche, la finesse de gravure (qui passe du 14nm FinFET à 7nm FinFET !! et non de 10nm à 7nm) permet une diminution de la consommation par 2 à performances égales, ou une augmentation de 1/4 en puissance de calcule à consommation identique. Donc si les changements fonctionnels n'ont pas énormément d’impacts, la simple augmentation de la finesse permet de grandes amélioration.

Ces GPU ciblent l'intelligence artificielle (Deep Learning et inférence), le calcul intensif (y compris en Cloud), et les serveurs de bureaux virtuels.
maintenant savoir où c'est utilisé, et pour faire quoi... aucune idée (à part de la virtualisation, qui est assez explicite).

ROCM c'est quoi ?

le 08/11/2018 à 15:52
darkman19320
Membre éclairé

ROCM est apparemment un logiciel développé par AMD qui regroupe tout un tas d'outil pour faire du Deep Learning.

le 08/11/2018 à 18:44