Oracle lance de nouveaux clusters pour l’entraînement de l’IA sur Oracle Cloud Infrastructure.
Oracle a récemment annoncé de nouveaux types de clusters destinés à l’entraînement en intelligence artificielle via Oracle Cloud Infrastructure (OCI). Les clusters les plus puissants seront basés sur les prochains GPU Nvidia Blackwell et offriront jusqu’à 2,4 ZettaFLOPS de performance en IA, surpassant même les clusters en intelligence artificielle récemment annoncés par Elon Musk.
Des superclusters Oracle pour des performances exceptionnelles
Les nouveaux superclusters sont configurables avec les GPU Hopper ou Blackwell de Nvidia pour l’IA et le HPC, ainsi que différents équipements réseau, offrant des performances et une latence optimales. Ces superclusters peuvent être équipés de différentes capacités de stockage en fonction des besoins de performance.
Les OCI Superclusters équipés de GPU H100 peuvent supporter jusqu’à 16 384 GPU, offrant une performance maximale de 65 FP8/INT8 exaFLOPS et un débit réseau combiné de 13 Pb/s.
Les OCI Superclusters alimentés par les GPU H200, qui seront lancés plus tard cette année, pourront monter jusqu’à 65 536 GPU, offrant jusqu’à 260 FP8/INT8 exaFLOPS et un débit réseau de 52 Pb/s.
Enfin, les OCI Superclusters basés sur les GPU Blackwell B200 pourront monter jusqu’à 131 072 GPU et offrir une performance maximale de 2,4 FP8/INT8 zettaFLOPS.
Une avancée technologique majeure
Ces futurs superclusters OCI dépassent largement les capacités des systèmes leaders actuels, offrant des performances inégalées. Selon Oracle, les superclusters B200 disposent de plus du triple de GPU que le supercalculateur Frontier et six fois plus que d’autres hyperscaleurs.
Diverses entreprises bénéficient déjà de cette infrastructure avancée, telles que WideLabs et Zoom, qui utilisent l’infrastructure AI haute performance d’OCI pour accélérer leur développement en intelligence artificielle tout en maintenant le contrôle de leur souveraineté.
Les futurs OCI Superclusters utiliseront les armoires GB200 NVL72 refroidies par liquide de Nvidia, avec 72 GPU communiquant entre eux à une bande passante agrégée de 129,6 To/s dans un seul domaine NVLink.
Les GPU Blackwell de Nvidia seront disponibles dans la première moitié de 2025. Cependant, la date à laquelle OCI proposera des clusters entièrement équipés de Blackwell reste incertaine.
Source : www.tomshardware.com