AMD annonce le lancement du GPU data center Instinct MI325X, rivalisant avec Nvidia H200
Dans la course à la puissance des futurs charges de travail d’IA générative, AMD prévoit de sortir un nouveau GPU de centre de données Instinct MI325X plus performant que le H200 de Nvidia en termes de capacité mémoire, de bande passante mémoire et de performances théoriques maximales pour les calculs en virgule flottante 8 bits et 16 bits.
Un nouvel GPU pour le data center
AMD prévoit de lancer un nouveau GPU de centre de données Instinct plus tard cette année avec une mémoire haute bande passante bien supérieure à celle de sa puce MI300X ou du H200 de Nvidia, permettant aux serveurs de gérer des modèles d’IA générative plus volumineux qu’auparavant.
Lors du Computex 2024 à Taïwan lundi, la société basée à Santa Clara, en Californie, devait dévoiler le GPU Instinct MI325X. Prévu pour arriver au quatrième trimestre, il offrira une mise à niveau substantielle en termes de capacité mémoire et de bande passante par rapport au MI300X, qui est devenu l’un des produits à “ramp-up” les plus rapides d’AMD à ce jour après son lancement en décembre.
Comparaison avec Nvidia
Contrairement au MI300X qui dispose de 192 Go de mémoire haute bande passante HBM3 et d’une bande passante mémoire de 5,3 Tbps, le MI325X offre jusqu’à 288 Go de HBM3e et 6 Tbps de bande passante, selon AMD. Huit de ces GPU s’intégreront dans ce que l’on appelle la plateforme Instinct MI325X, qui a la même architecture que la plateforme MI300X intégrée dans les serveurs conçus par les OEM.
AMD a déclaré que le MI325X présente plusieurs avantages par rapport au H200 de Nvidia, en matière de capacité et de bande passante mémoire notamment.
En outre, le MI325X permet aux serveurs de gérer un modèle de 1 trillion de paramètres dans son intégralité, soit le double de ce qui est possible avec le H200, selon la société.
Mise à jour de la feuille de route : un nouveau GPU pour le data center chaque année
AMD a annoncé ces détails dans le cadre d’un plan nouvellement divulgué visant à lancer un nouveau GPU pour le data center chaque année, à commencer par le MI325X, qui, comme le MI300X, utilise l’architecture CDNA 3 de l’entreprise spécialement conçue pour les applications de data center.
Andrew Dieckmann, responsable de la division GPU pour data center d’AMD, a déclaré que les efforts de la société dans ce domaine ont déjà reçu le soutien de plusieurs OEM et fournisseurs de services cloud, dont Dell Technologies, Lenovo, Hewlett Packard Enterprise, Microsoft et Oracle.
Source : www.crn.com