Intel lance Gaudi 3 pour l’IA : prix inférieur à Nvidia H100 et H200, quel impact sur le secteur ?
Intel a officiellement introduit son accélérateur Gaudi 3 pour les charges de travail en intelligence artificielle aujourd’hui. Les nouveaux processeurs sont plus lents que les populaires GPU H100 et H200 de Nvidia pour l’IA et le calcul haute performance, donc Intel mise sur le succès de son Gaudi 3 en raison de son prix inférieur et de son coût total de possession plus bas.
Caractéristiques du processeur Gaudi 3
Le processeur Gaudi 3 d’Intel utilise deux chiplets qui intègrent 64 cœurs de processeurs tensoriels (TPCs, structure MAC 256×256 avec accumulateurs FP32), huit moteurs de multiplication matricielle (MMEs, processeur vectoriel de 256 bits de large), et 96 Mo de cache SRAM intégré avec une bande passante de 19,2 To/s. De plus, le Gaudi 3 intègre 24 interfaces réseau 200 GbE et 14 moteurs multimédias – ces derniers capables de gérer les formats vidéo H.265, H.264, JPEG et VP9 pour prendre en charge le traitement visuel. Le processeur est accompagné de 128 Go de mémoire HBM2E répartie en huit piles de mémoire offrant une bande passante massive de 3,67 To/s.
Comparaison avec le Gaudi 2
Le Gaudi 3 d’Intel représente une amélioration massive par rapport au Gaudi 2, qui possède 24 TPCs, deux MMEs et 96 Go de mémoire HBM2E. Cependant, Intel a simplifié à la fois les TPCs et les MMEs, le processeur Gaudi 3 ne supportant que des opérations matricielles FP8 ainsi que des opérations matricielles et vectorielles BFloat16 (c.-à-d. plus de FP32, TF32 et FP16).
Performance et prix
En termes de performance, Intel indique que le Gaudi 3 peut offrir jusqu’à 1856 TFLOPS en matrice BF16/FP8 ainsi que jusqu’à 28,7 TFLOPS en vecteur BF16 pour une TDP d’environ 600 W. Comparé au H100 de Nvidia, du moins sur le papier, le Gaudi 3 offre une performance matricielle BF16 légèrement inférieure (1 856 vs 1 979 TFLOPS), une performance matricielle FP8 deux fois inférieure (1 856 vs 3 958 TFLOPS) et une performance en vecteur BF16 significativement inférieure (28,7 vs 1 979 TFLOPS).
Plus important que les spécifications brutes sera la performance réelle du Gaudi 3 en usage réel. Il doit rivaliser avec les processeurs Instinct MI300 d’AMD ainsi que les H100, B100 et B200 de Nvidia. Cela reste à voir, car beaucoup dépend des logiciels et d’autres facteurs. Intel a montré quelques diapositives affirmant que le Gaudi 3 peut offrir un avantage significatif en termes de performance par rapport au H100 de Nvidia.
Plus tôt cette année, Intel a indiqué qu’un kit d’accélérateur basé sur huit processeurs Gaudi 3 sur une carte-mère coûterait 125 000 dollars, ce qui signifie que chacun coûterait environ 15 625 dollars. En revanche, une carte Nvidia H100 est actuellement disponible pour 30 678 dollars, ce qui signifie qu’Intel prévoit en effet d’avoir un avantage de prix important par rapport à son concurrent. Cependant, avec les potentiels avantages de performance massifs offerts par les GPUs Blackwell B100/B200, il reste à voir si la société bleue pourra maintenir son avantage sur son rival.
Conclusion
Dans un secteur en pleine transformation, Intel affirme que le lancement de Xeon 6 avec P-cores et des accélérateurs d’IA Gaudi 3 permet à ses clients de mettre en place toutes leurs charges de travail avec une meilleure performance, une meilleure efficacité et une meilleure sécurité. Les accélérateurs d’IA Gaudi 3 d’Intel seront disponibles sur IBM Cloud et Intel Tiber Developer Cloud. Par ailleurs, les systèmes basés sur les processeurs Xeon 6 et le Gaudi 3 seront disponibles en général chez Dell, HPE et Supermicro au quatrième trimestre, les systèmes de Dell et de Supermicro étant expédiés en octobre et les machines de Supermicro en décembre.
Source : www.tomshardware.com