Il s’agit d’une rumeur concernant la prochaine génération de cartes graphiques Nvidia. Ces nouvelles révélations viennent de Kopte7kimi, qui parle du schéma bloc de la nouvelle génération de greens. Une image schématique du GPU AD102 “Ada Lovelace” nous permettra de prédire les performances du RTX 40 de prochaine génération.
Table of Contents
RTX 40 : Fiche technique impressionnante (si vraie)
Tout d’abord, le GPU Ada Lovelace AD102 sera équipé de jusqu’à 12 GPC (Graphics Processing Clusters). C’est une augmentation de 70% par rapport au GA102 (le plus grand de la gamme actuelle) avec seulement 7 GPC. Chaque GPU sera composé de 6 TPC et 2 SM, la même configuration que les puces existantes. Chaque SM (Streaming Multiprocessor) abritera quatre sous-cœurs, ce qui est également le même que le GPU GA102. Le vrai changement est la configuration du noyau FP32 et INT32. Chaque sous-cœur contiendra 128 unités FP32, mais la combinaison d’unités FP32 + INT32 atteindra 192. En effet, l’unité FP32 ne partage pas le même sous-cœur que l’unité IN32. 128 cœurs FP32 sont séparés de 64 cœurs INT32.
Une des images graphiques du GPU RTX 40 de Kopte7kimi
La mise en cache devrait être un autre domaine dans lequel NVIDIA se lance sur les GPU Ampère existants. Le GPU Ada Lovelace contiendra 192 Ko de cache L1 par SM, une augmentation de 50% par rapport à Ampere. Cela équivaut à un total de 4,5 Mo de cache L1 sur le GPU AD102 supérieur. Le cache L2 sera augmenté à 96 Mo, un nombre qui a été fréquemment mentionné dans plusieurs fuites. C’est presque 16x par rapport à un GPU Ampère qui n’héberge que 6 Mo de cache L2. Le cache sera partagé sur le GPU.
Si la fuite est vraie, notre cache L2 croît de manière exponentielle, augmentant au total à 96 Mo pour’ AD102 Concernant ROP, le nombre d’unités sur cette architecture sera doublé, 32 GPC Précisément, cela nous donnera un total de Chapitre 384 Pour un éventuel RTX 4090 et 112 pour un RTX 3090… sur le papier c’est horrible.
Comparaison des fonctionnalités du GPU. AD102 sera le sommet de la série RTX 40
Mais à quels gains peut-on vraiment s’attendre après cette avalanche de données technologiques ?
Evidemment c’est trop tôt, mais si ces éléments se confirment, la fiche technique montre une énorme différence par rapport à l’ampère. en conclusion:
- X2 GPC (par rapport à Ampère)
- 50 % de cœurs en plus (par rapport à Ampère)
- 50 % d’augmentation du cache L1 (par rapport à Ampère)
- 16x plus de cache L2 (par rapport à Ampère)
- X2 ROP (par rapport à Ampère)
- Gen 4 Tensor et Gen 3 RT Cores
Mais en termes de performances réelles, à quoi peut-on s’attendre ?
C’est très difficile car il nous manque une donnée clé : la fréquence de fonctionnement.
Si on spécule un peu sur le sujet, on essaiera de se projeter sur la puissance en FP32 90TFLOPS, plus du double du GA102 actuel. Cependant, avec TFLOPS, nous pouvons aussi avoir des surprises. S’ils donnent une idée des performances brutes, il ne leur est en aucun cas permis de préjuger des résultats en usage “quotidien”. Fuite de l’annonce de x2 à x2.2 par rapport au RTX 30… évidemment il y aura des gains, ça a l’air substantiel. Mais pour prendre une décision au-delà, il faudra attendre encore un peu.
Il s’agit d’une rumeur concernant la prochaine génération de cartes graphiques Nvidia. Ces nouvelles révélations viennent de Kopte7kimi, qui parle du schéma bloc de la nouvelle génération de greens. Une image schématique du GPU AD102 “Ada Lovelace” nous permettra de prédire les performances du RTX 40 de prochaine génération.
RTX 40 : Fiche technique impressionnante (si vraie)
Tout d’abord, le GPU Ada Lovelace AD102 sera équipé de jusqu’à 12 GPC (Graphics Processing Clusters). C’est une augmentation de 70% par rapport au GA102 (le plus grand de la gamme actuelle) avec seulement 7 GPC. Chaque GPU sera composé de 6 TPC et 2 SM, la même configuration que les puces existantes. Chaque SM (Streaming Multiprocessor) abritera quatre sous-cœurs, ce qui est également le même que le GPU GA102. Le vrai changement est la configuration du noyau FP32 et INT32. Chaque sous-cœur contiendra 128 unités FP32, mais la combinaison d’unités FP32 + INT32 atteindra 192. En effet, l’unité FP32 ne partage pas le même sous-cœur que l’unité IN32. 128 cœurs FP32 sont séparés de 64 cœurs INT32.
Une des images graphiques du GPU RTX 40 de Kopte7kimi
La mise en cache devrait être un autre domaine dans lequel NVIDIA se lance sur les GPU Ampère existants. Le GPU Ada Lovelace contiendra 192 Ko de cache L1 par SM, une augmentation de 50% par rapport à Ampere. Cela équivaut à un total de 4,5 Mo de cache L1 sur le GPU AD102 supérieur. Le cache L2 sera augmenté à 96 Mo, un nombre qui a été fréquemment mentionné dans plusieurs fuites. C’est presque 16x par rapport à un GPU Ampère qui n’héberge que 6 Mo de cache L2. Le cache sera partagé sur le GPU.
Si la fuite est vraie, notre cache L2 croît de manière exponentielle, augmentant au total à 96 Mo pour’ AD102 Concernant ROP, le nombre d’unités sur cette architecture sera doublé, 32 GPC Précisément, cela nous donnera un total de Chapitre 384 Pour un éventuel RTX 4090 et 112 pour un RTX 3090… sur le papier c’est horrible.
Comparaison des fonctionnalités du GPU. AD102 sera le sommet de la série RTX 40
Mais à quels gains peut-on vraiment s’attendre après cette avalanche de données technologiques ?
Evidemment c’est trop tôt, mais si ces éléments se confirment, la fiche technique montre une énorme différence par rapport à l’ampère. en conclusion:
- X2 GPC (par rapport à Ampère)
- 50 % de cœurs en plus (par rapport à Ampère)
- 50 % d’augmentation du cache L1 (par rapport à Ampère)
- 16x plus de cache L2 (par rapport à Ampère)
- X2 ROP (par rapport à Ampère)
- Gen 4 Tensor et Gen 3 RT Cores
Mais en termes de performances réelles, à quoi peut-on s’attendre ?
C’est très difficile car il nous manque une donnée clé : la fréquence de fonctionnement.
Si on spécule un peu sur le sujet, on essaiera de se projeter sur la puissance en FP32 90TFLOPS, plus du double du GA102 actuel. Cependant, avec TFLOPS, nous pouvons aussi avoir des surprises. S’ils donnent une idée des performances brutes, il ne leur est en aucun cas permis de préjuger des résultats en usage “quotidien”. Fuite de l’annonce de x2 à x2.2 par rapport au RTX 30… évidemment il y aura des gains, ça a l’air substantiel. Mais pour prendre une décision au-delà, il faudra attendre encore un peu.
Discussion about this post