On va presque doubler les performances grâce au nouveau process de gravure permettant de mettre bien plus de coeur pour une consommation mieux maitrisé... Comme à chaque fois qu'on passe sur un nouveau process en fait!
Comme dit la loi de moore d'ailleurs. Mais maintenant, on parle du double du temps pour la prochaine évolution de finesse de gravure et donc une évolution de performance qui va un peu ralentir même pour les cartes graphiques.
Du coup, cette génération "Pascal" est un peu comme le Skylake des CPU, c'est LA génération à acheté. (eg étant donné que après pendant 3 ans, l'évolution sera la mais mineur)
Du moins, théoriquement.
Nous saurons bientôt si c'est le cas en pratique également
Mais ils ont annoncé la puce complète, le Tesla P100 !
Le nombre de core CUDA n'as pas tant augmenter que ça (+ 15%) mais par contre en ce qui concerne les calculs FP16/FP32/FP64 explose!
Pour la partie purement technique:
Pendant que Maxwell2 tapait 6,8 Tflops en FP16/FP32 et Kepler 4,7 Tflops
Pascal explose en demi précision avec 21,2 Tflops en FP16 et 10,6 Tflops en FP32!
Sans compter la gestion en double précision du FP64, ce qui le rend 20x plus performant que Maxwelle et 4x plus rapide que Kepler!
Voila pour la technique.
En pratique, l'architecture à été conçu pour être encore plus "scalable" càd que chaque "bloc" d'unité de calcul à été doublé.
Technique encore:
Avant (Maxwell), nous avions 24 blocs d'unité de calcul, composant chacun 128 CUDA coeurs.
Maintenant, nous avons 56 blocs de calcul de 64 CUDA coeurs.
En pratique, cela veut dire que chaque bloc à été simplifié mais aussi qu'il y aura une amélioration non négligeable sur chaque coeur.
En effet, au lieu de diviser les ROPs, les unités de texturing etc. sont multiplié par 56 plutôt que par 24.
(Donc chaque coeur plus simple mais comme il y en a 2x plus et que chaque bloc doit être complet, une augmentation logique)
Du coup, la mémoire cache a également été beaucoup augmenté comparé à avant.
En pratique, pour nous, cela voudra dire que surtout les jeux DirectX12 vont largement augmenter.
Les coeurs vont probablement encore être plus simplifier, mais nous aurons un GTX1080 avec un peu moins ou le même nombre de CUDA coeur avec un gain de 70% des perf' grâce à cette augmentation de fréquence et à l'amélioration de la structure.
Cette puce va couter bien moins chère à NVIDIA pour la production et pourra la décliner encore plus facilement que Maxwell.