Nvidia révèle les mises à jour des GPU data center jusqu’en 2027

La roadmap de Nvidia pour les centres de données en 2026 et 2027 a été dévoilée à la conférence GTC 2025 de l’entreprise aujourd’hui. Les nouvelles configurations prévues pour les futurs Rubin et Rubin Ultra ont été présentées. Même si Nvidia vient de terminer la production complète du Blackwell B200, et que le Blackwell B300 est prévu pour la seconde moitié de 2025, l’entreprise anticipe déjà les deux prochaines années et aide ses partenaires à planifier les transitions à venir.
Des détails sur les futures solutions de Nvidia
Une des informations importantes révélées est que “Blackwell a été mal nommé.” En bref, le Blackwell B200 dispose en réalité de deux chips par GPU, ce qui modifie la topologie de NVLink. Ainsi, bien que l’entreprise appelle la solution actuelle Blackwell B200 NVL72, il aurait été plus approprié de l’appeler NV144L, selon le PDG Jensen Huang. Ce que Nvidia fera avec les solutions Rubin à venir.
Les évolutions à venir
Avec le Rubin NVL144, compatible avec l’infrastructure existante Blackwell NVL72, on retrouve une configuration similaire à celle du Blackwell Ultra B300 NVL72 pour comparaison. Le B300 NVL72 offre 1.1 pétaflops de calcul FP4 dense, tandis que le Rubin NVL144, avec les mêmes 144 dies de GPU, offrira 3.6 pétaflops de calcul FP4 dense, et 1.2 exaflops de calcul FP8 en entraînement, contre seulement 0.36 exaflops pour le B300, soit une amélioration des performances de calcul de 3,3 fois.
Le Rubin marquera également le passage de HBM3/HBM3e à HBM4, avec l’utilisation de HBM4e pour le Rubin Ultra. La capacité mémoire restera de 288 Go par GPU, tout comme pour le B300, mais la bande passante passera de 8 To/s à 13 To/s. Il y aura également un NVLink plus rapide qui doublera le débit à 260 To/s au total, ainsi qu’un nouveau lien CX9 entre les racks, avec 28,8 To/s (le double de la bande passante du B300 et CX8).
Le futur des CPU et GPU
L’autre moitié de la famille Rubin sera le CPU Vera, remplaçant les CPU Grace actuels. Vera sera un CPU relativement petit et compact, avec 88 cœurs ARM personnalisés et 176 threads. Il disposera également d’une interface NVLink cœur à cœur de 1,8 To/s pour se connecter aux GPU Rubin.
Le Rubin Ultra arrivera dans la seconde moitié de 2027, avec un autre grand bond en avant du côté GPU. Le rack complet sera remplacé par une nouvelle disposition, NVL576, contenant jusqu’à 576 GPU par rack, chacun ayant une consommation électrique non spécifiée.
Le calcul d’inférence avec FP4 atteindra 15 exaflops, avec 5 exaflops de calcul d’entraînement FP8. C’est environ 4 fois le calcul du Rubin NVL144, ce qui est logique compte tenu de la multiplication par quatre des GPUs. Les GPUs comporteront cette fois-ci quatre dies de GPU par package pour accroître la densité de calcul.
Source : www.tomshardware.com