Nvidia GeForce GTX Titan en test : big Kepler débarque enfin !

Tags : GeForce; GK110; GTX Titan; Kepler; Nvidia;

Publié le 21/02/2013 par Damien Triolet

Le GK110

Le GK110 est basé sur la même architecture Kepler que les GPU GK104/GK106/GK107 qui forment la gamme GeForce 600.

Il conserve ainsi l'organisation des unités en SMX qui englobent chacun 192 unités de calcul, 16 unités de texturing et un cache L1 de 64 Ko. Le SMX représente une évolution du SM de la génération Fermi, optimisée pour un rendement supérieur, notamment sur le plan énergétique. Nous avions décrit cette évolution en détail dans le test de la GeForce GTX 680. Chaque SMX est capable de débiter jusqu'à 192 instructions FMA par cycle (384 flops), 4 pixels par cycle ainsi qu'un triangle tous les 2 cycles. Petite différence, le GK110 intègre un rasterizer, chargé de découper les triangles en pixels, par groupe de 3 SMX alors que les autres GPU Kepler le font par groupe de 2 SMX.

L'interface mémoire est également du même type avec des blocs contenant un contrôleur mémoire de 64 bits, optimisé pour la GDDR5 haute fréquence, un cache L2 de 256 Ko et 8 ROP chargés d'écrire les pixels après leur rendu.

Alors que le GK104 intègre 8 SMX, 4 rasterizers et 4 contrôleurs mémoire, le GK110 passe respectivement à 15, 5 et 6. Il dispose ainsi au total de 2880 unités de calcul, de 240 unités de texturing, d'un cache L2 de 1.5 Mo, d'un bus mémoire de 384-bit et de 48 ROP. Ses débits passent de 32 pixels et 4 triangles par cycle pour le GK104 à 40 pixels et 7.5 triangles par cycle.

Vous remarquerez que le débit de pixels est limité par le nombre de rasterizer (chacun peut générer 8 pixels par cycle) bien que les ROP soient capables d'en écrire 48 par cycle. Ces ROP supplémentaires peuvent cependant être utiles dans le cas du traitement de l'antialiasing de type multisample qui ajoute une charge importante à leur niveau.

Comme le GK104, le GK110 est fabriqué en 28 nanomètres chez TSMC. Le nombre plus élevé de blocs d'exécution exige 7.1 milliards de transistors contre 3.5 milliards pour le GK104 soit une complexité doublée. De quoi faire exploser les coûts de fabrication puisque cela correspond à une surface de 569 mm² contre "seulement" 294 mm² pour le GK104.

L'architecture évolue légèrement

Par rapport aux autres GPU Kepler, il y a malgré tout quelques petites différences, mais toutes concernent uniquement le GPU Computing. C'est probablement pour cela que le GK110 est vu comme biaisé vers ce domaine, mais il faut garder en tête qu'à l'échelle de l'architecture du GPU, ces modifications sont relativement mineures.

La plus importante concerne l'ajout de 64 unités de calcul double précision dans chaque SMX, en jaune dans la représentation de celui-ci :

La seconde nouveauté concerne le processeur de commande qui évolue pour gagner en flexibilité : permettre la gestion de plusieurs queues d'exécution pour mieux alimenter le GPU, jusqu'à 32, et être capable de lancer des tâches de lui-même pour libérer le CPU et éviter les aller-retour de données entre le GPU et la mémoire centrale. Deux technologies qui dans le langage Nvidia se nomment respectivement HyperQ et Dynamic Parallelism.

Nous retrouvons ensuite une protection ECC pour l'ensemble des mémoires internes et quelques nouvelles instructions pour accéder directement au cache dédié au texturing (12 Ko par SMX), pour déplacer des données d'un thread à l'autre ou encore pour compléter le support des opérations atomiques.