Ada Lovelace était intelligente, ambitieuse, passionnée, curieuse… Au milieu du siècle dernier, cent ans après sa mort, plusieurs chercheurs ont découvert son travail et un ensemble de contributions qui, des décennies plus tard, ont été très précieuses pour le développement de l’informatique et de la programmation. La pertinence historique de cette visionnaire est incontestable, c’est pourquoi NVIDIA a décidé de lui rendre hommage en donnant son nom à l’architecture de sa famille de GPU GeForce RTX 40.
Le but de cet article est d’étudier les nombreuses innovations introduites par les ingénieurs de NVIDIA dans ces nouveaux processeurs graphiques, mais avant d’entrer dans le vif du sujet, cela vaut la peine d’être récapitulé. Les premières cartes graphiques appartenant à la série GeForce RTX 40 qui arriveront dans les magasins seront le RTX 4090 et le RTX 4080. Et c’est que, étonnamment, NVIDIA a décidé de lancer deux versions différentes de cette dernière solution graphique.
L’une des RTX 4080 intègre 16 Go de VRAM de type GDDR6X, et l’autre 12 Go de ce même type de mémoire. Cependant, les différences entre ces deux cartes graphiques ne s’arrêtent pas là. Et c’est que votre GPU ne fonctionne pas de la même manière et que votre bus mémoire est différent. Dans le tableau que nous publions en dessous de ces lignes nous recueillons ces différences. Une autre information intéressante : Samsung ne fabrique plus ces GPU pour NVIDIA. Le RTX 40 est produit par TSMC en utilisant son nœud lithographique de 4 nm.
Table of Contents
Les GeForce RTX 4090 et 4080 contre les GeForce RTX 3090 Ti et 3080 Ti
nvidia geforce rtx 4090 | nvidia geforce rtx 3090ti | nvidia geforce rtx 4080 | NVIDIA GEFORCE RTX 3080 TI | |
---|---|---|---|---|
architecture | Ada Lovelace | Ampère | Ada Lovelace | Ampère |
transistors | 76 milliards | 28,3 milliards | Non disponible | 28,3 milliards |
photolithographie | 4 nm TSMC | 8 nm Samsung (technologie d’intégration personnalisée pour NVIDIA) | 4 nm TSMC | 8 nm Samsung (technologie d’intégration personnalisée pour NVIDIA) |
cœurs cuda | 16 384 | 10 752 | 9728 (16 Go) 7680 (12 Go) | 10 240 |
cœurs rt | 128 (3ème génération) | 84 (2e génération) | 76 (3e génération) | 80 (2ème génération) |
noyaux tenseurs | 512 (4ème génération) | 336 (3ème génération) | 304 (4ème génération) | 320 (3ème génération) |
unités de calcul (cu) | 128 | 84 | 76 | 80 |
cache de niveau 1 | 128 Ko (par SM) | 128 Ko (par SM) | 128 Ko (par SM) | 128 Ko (par SM) |
fréquence d’horloge maximale | 2,52 GHz | 1,86 GHz | 2,51 GHz (16 Go) 2,61 GHz (12 Go) | 1,67 GHz |
mémoire dédiée | 24 Go de mémoire GDDR6X | 24 Go de mémoire GDDR6X | 16 Go GDDR6X ou 12 Go GDDR6X | 12 Go de mémoire GDDR6X |
bus mémoire | 384 bits | 384 bits | 256 bits (16 Go) 192 bits (12 Go) | 384 bits |
vitesse de transfert de la mémoire | 1008 Go/s | 1008 Go/s | 735 Go/s (16 Go) | 912 Go/s |
tflops de shader (fp32) | 90 | 40 | 49 | 3. 4 |
opérations de pixellisation | 192 RDP/s | 112 RDP/s | 96 RDP/s | 112 RDP/s |
unités de carte de texture | 512 | 336 | 304 | 320 |
taux de texture | 1290 Gtexels/s | 625 Gtexels/s | 761,5 Gtexels/s | 532,8 Gtexels/s |
taux de pixels | 483,8 Gpixels/s | 208,3 Gpixels/s | 240,5 Gpixels/s | 186,5 Gpixels/s |
direct x 12 ultime | Oui | Oui | Oui | Oui |
interface pci express | PCIe 4.0 | PCIe 4.0 | PCIe 4.0 | PCIe 4.0 |
examen hdmi | 2.1 | 2.1 | 2.1 | 2.1 |
examen du port d’affichage | 1.4a | 1.4a | 1.4a | 1.4a |
dlss | 3 | deux | 3 | deux |
emplacements occupés | 3 | 3 | 3 (16 Go) 2 ou 3 (12 Go) | deux |
température maximale du processeur graphique | 90ºC | 92ºC | 90ºC | 93ºC |
consommation moyenne | 450 watts | 450 watts | 320 watts | 350 watts |
puissance recommandée pour l’alimentation | 850 watts | 850 watts | 750 watts | 750 watts |
connecteurs d’alimentation | 3 x 8 broches ou 1 câble PCIe Gen 5 450 watts ou plus | 3 x 8 broches | 16 Go : 3 x 8 broches ou 1 câble PCIe Gen 5 de 450 watts ou plus 12 Go : 2 x 8 broches ou 1 câble PCIe Gen 5 300 watts ou plus | 2 x 8 broches |
le prix | A partir de 1959 euros | 1 576,84 € | A partir de 1469 euros (16 Go) A partir de 1099 euros (12 Go) | 1 563,76 € |
L’architecture Ada Lovelace de la GeForce RTX 40, à la loupe
NVIDIA n’a pas été délicat lorsqu’il s’est agi de communiquer ce que représente l’arrivée de l’architecture Ada Lovelace pour cette entreprise : un pas de géant en termes de performances et d’efficacité. Cela semble bien, cela ne fait aucun doute, mais comme cette affirmation provient d’une partie intéressée, nous serions sages de la prendre avec un certain scepticisme jusqu’à ce que nous ayons la chance de regarder de plus près l’une des nouvelles cartes graphiques GeForce RTX 40 .
En tout cas, au-delà de l’engagement envers la technologie d’intégration 4 nm de TSMC au détriment de la lithographie 8 nm de Samsung utilisée dans la fabrication des processeurs graphiques GeForce RTX 30, les nouveaux GPU NVIDIA nous offrent une nouvelle génération de cœurs RT et de cœurs Tensor, ainsi que plus de cœurs CUDA que jamais. Ils sont également livrés avec des fréquences d’horloge plus élevées et implémentent des technologies de traitement d’image plus sophistiquées. C’est ainsi que les brutales (et chères) GeForce RTX 40 les dépensent.
Plus de cœurs CUDA et, en plus, les cœurs RT de 3e génération arrivent
Les noyaux CUDA sont chargés d’effectuer les calculs complexes qui sont…
Discussion about this post