Preview : Le Quad SLI en pratique - version imprimable

Preview : Le Quad SLI en pratique
Cartes Graphiques
Publié le Lundi 1er Mai 2006 par Damien Triolet et Marc Prieur

URL: /articles/621-1/preview-quad-sli-pratique.html

Page 1 - Historique, 4 GPU : quelle utilité ?

Mi 2004, Nvidia remettait au goût du jour l’acronyme SLI de 3dfx avec son propre SLI (cette fois pour Scalable Link Interface) permettant de combiner les performances de deux GeForce. Disponible dans le commerce pour la fin de l’année, cette technologie a depuis fait son bout de chemin, l’amélioration des drivers et le marketing de Nvidia aidant.

Il ne faut toutefois pas surestimer son utilisation chez les joueurs, comme le rappellent les dernières statistiques de Valve effectuées en Mars sur 700 000 joueurs : 0.77% d’entre eux utilisent un système Multi-GPU, ces systèmes étant par contre à 98.2% des SLI, et à 1.8% des CrossFire. De plus, 0.2% des joueurs ont un 24", et 0.1% plus grand.

Reste que cette minorité compte pour ATI comme Nvidia, du fait notamment de son rôle de prescripteur et de l’image de marque générale que peuvent tirer les deux firmes du haut de gamme. A l’attention de ces fanatiques de performances, Nvidia propose donc aujourd’hui d’aller plus loin avec le Quad SLI.

4 GPU ? Pour quoi faire ?

Avant de parler du Quad SLI en lui-même, il convient de revenir sur une idée reçue par certains : oui, 2 GPU haut de gamme ne suffisent pas toujours et le fait d’avoir plus de performances n’est pas forcément dénué d’intérêt.

En résolution native sur un 24" LCD, c´est-à-dire en 1920*1200, dans la plupart des cas, vous n’aurez pas de souci avec un système SLI haut de gamme, il sera même généralement possible d’activer l’antialiasing et/ou le HDR. Parmi les jeux récalcitrants, on notera Oblivion sur lequel on est plutôt à 40 images/s en extérieur tout à fond sans l’AA ni HDR, mais pour un jeu de rôle cela ne pose pas trop de problèmes.

Le jeu sur 30" (ici comparé à un 19") : magnifique mais ultra gourmand ...
Par contre, passer sur un écran 30" tel que le dernier Dell 3007WFP avec « seulement » 2 7900 GTX est plus délicat. Sa résolution native étant de 2560*1600 pixels, il nécessite une puissance accrue de 78% par rapport à un 24" dans sa résolution native ! Au mieux, avec deux cartes, on peut jouer sans AA ou HDR, au pire il faudra baisser les options graphiques, notamment dans jeux basés sur des moteurs graphiques avancés tels que FEAR ou encore Oblivion.

Oblivion en 2560*1600 + AA 32x sur Quad SLI : 1 fps. A quand un SLI de 240 GPU ?
Pour aller au delà, il faut plus de puissance, et en attendant une prochaine génération de GPU il n’y a pas 36 solutions : il faut combiner les performances de GPU actuels.

Page 2 - 7900 GX2 et Quad SLI

Les 7900 GX2 : Un avant goût du Quad SLI

C’est lors du CES de Las Vegas que Nvidia a parlé pour la première fois de Quad SLI. Basé sur des GeForce 7800 GTX, cette solution était réservée uniquement à Dell et fût rapidement remplacée au CeBIT en mars par une autre à base de GeForce 7900, l’exclusivité de Dell sautant au passage.

D’un point de vue hardware, le Quad SLI est basé sur deux cartes 7900 GX à double PCB, chaque PCB accueillant un GeForce 7900 et 512 Mo de GDDR3. Les interconnexions entre GPU sont multiples, chaque 7900 étant doté de deux ports SLI. Ainsi, si les deux GPU d’une même carte sont interconnectés en SLI, ces GPU sont également connectés à un GPU de la seconde carte (GPU 1 de la carte 1 avec GPU 1 de la carte 2, GPU 2 avec GPU 2).

Les connecteurs entre les deux GX2

Au niveau du PCI Express, chaque carte bi GPU est dotée d’un switch PCI Express x48 qui est relié aux deux GPU et à la carte mère : ceci permet aux deux GPU de communiquer directement via le PCI Express également, sans passer par la carte mère.

Les fréquences utilisées sont de 500 MHz pour le 7900, et 600 MHz pour la GDDR3. On est donc forcément bien en dessous des 650/800 MHz de 7900 GTX, alors qu’un 7900 GT est pour sa part à 450/660.

Gros plan sur le 1er PCB de la GX2

Il faut noter que Nvidia devrait annoncer début mai de nouvelles cartes bi-GPU destinées au Quad SLI, les 7950 GX2. De 31cm de longueur sur les 7900 GX2, on passera à 22.5cm soit la même taille qu’une 7900 GTX. De plus, selon les rumeurs, chaque 7950 GX2 serait vue comme une seule carte par le système, ce qui permettrait au-delà du Quad SLI de disposer à priori sur n’importe quel port PCI Express x16 (quel que soit le chipset) de la puissance de deux G71.

Fonctionnement

Pour rappel, en SLI, 2 modes de rendu sont proposés. Le premier, le SFR (Split Frame Rendering), consiste à couper l’image en 2, chaque GPU s’occupant de traiter une partie. La séparation est déterminée dynamiquement de manière à répartir au mieux la charge entre les 2 GPUs. Le second, l’AFR (Alternate Frame Rendering), consiste simplement à ce que chaque GPU calcule une image sur 2. Dans les 2 cas, le second GPU envoie, via le connecteur SLI, son travail au second qui s’occupe de reformer les images complètes ou de les afficher dans le bon ordre. Chacun de ces modes à des avantages et des inconvénients, parfois l’un est plus performant, parfois l’autre ne peut pas être utilisé sans entraîner de bug graphique, mais en règle général, l’AFR est le mode qui affiche les meilleures performances.

En Quad SLI, on retrouve bien entendu ces 2 modes qui sont en toute logique étendu à 4 GPU. En SFR, l’image est dynamiquement divisée en 4 et en AFR chaque GPU se charge d’une image sur quatre. Tout n’est cependant pas aussi simple qu’il n’y paraît puisque les transferts entre cartes sont plus complexes. Nvidia étant peu bavard à ce niveau, nous ne pouvons pas savoir avec certitude comment les transferts sont effectués. Le premier GPU est raccordé au GPU 2 et 3, mais pas au 4. Pour que ce dernier puisse envoyer sa partie du travail, il doit envoyer les données par le bus PCI Express ou faire transiter ses données par le GPU 2 ou 3. Vu les nombreuses connexions inter-GPU, plusieurs possibilités existent, à Nvidia de trouver la meilleure afin d’obtenir le gain le plus important au niveau des performances tout en évitant tout problème de synchronisation entre les 4 GPUs.

Un troisième mode de rendu fait son apparition : l’AFR de SFR. Les GPU travaillent par paire en SFR sur une image sur 2. Par exemple, les GPU 1 et 2 vont calculer ensemble les images impaires et le GPU 1 va les assembler. Les GPU 3 et 4 vont, eux, calculer les images paires que le GPU 3 va assembler. Du coup, les transferts sont simplifiés et une fois les images calculées, seul le GPU 3 doit communiquer avec le GPU principal. Il s’agit plus que probablement du mode le plus adapté au Quad SLI.

Introduit en septembre dernier, le SLI antialiasing est lui aussi étendu au Quad SLI. Pour rappel, il consiste à ce que chaque GPU calcule la même image mais avec un léger décalage. Les images sont ensuite mélangées ce qui revient à faire de l’antialiasing ou à combiner l’antialiasing de plusieurs images. La première possibilité n’a pas encore été exploitée, mais elle pourrait l’être un jour, par exemple, pour apporter le support de l’antialiasing en mode HDR lorsqu’il n’est pas supporté de manière classique. La seconde possibilité à été utilisée pour combiner 2 images en FSAA 4x de manière à obtenir un FSAA 8x ou 2 images en FSAA 8xS pour obtenir un FSAA 16xS. Le S indique que le FSAA est un mélange de multisampling et de supersampling : en 1024 x 768, en FSAA 8xS, l’image est calculée en MSAA 4x mais en 1024 x 1536 et puis redimensionnée.

FSAA tester permet d’observer le positionnement des samples dans les différents modes d’antialiasing. En rouge nous obtenons la position des samples et en vert la position utilisée pour le calcul de la couleur (et donc des coordonnées des textures). La position des samples influe sur l’antialiasing au niveau de la géométrie puisqu’elle indique si chaque sample se trouve au non dans un triangle donné. Mieux elles sont réparties, mieux seront filtrées les différentes arrêtes. Les points verts représentent un filtrage appliqué à la scène dans sa globalité : textures, objets alpha (grillages etc.), eau etc. l’aliasing est donc corrigé à d’autres niveaux que la géométrie mais en contrepartie certaines parties de l’image peuvent devenir plus floues que ce qu’elles ne devraient être.

AA 4x, AA 8xS, SLI AA 8x, SLI AA 16x

3 nouveaux modes d’antialiasing font leur apparition avec le Quad SLI, des FSAA 8x et 16x légèrement différents et un nouveau mode, le FSAA 32x qui combine pas moins de 4 images calculées en FSAA 8xS !

Quad SLI AA 8x, Quad SLI AA 16x, Quad SLI AA 32x

Nous avons donc affaire à 3 modes de FSAA 8x chez Nvidia. Cependant, aucun d’entre eux n’affiche un positionnement des samples optimal. Contrairement à ATI, Nvidia ne dispose pas d’un moteur de FSAA programmable qui permet de modifier le positionnement de ces samples. Nvidia doit donc se débrouiller avec une version fixe. Dans le cas du mode 8xS, Nvidia double la résolution verticale. En SLI et Quad SLI 8x, un décalage est appliqué à chaque image calculée en MSAA 4x (nous avons donc affaire à de l’AFR de SLI 8x en mode Quad SLI, vous suivez ?), mais ce décalage est différent entre les 2 modes. Comme vous pouvez le voir sur les images, il est plus important en mode SLI qu’en mode Quad SLI. Nvidia semble avoir utilisé la valeur du décalage du mode Quad SLI 16x qui doit forcément être plus réduite de manière à rester dans "la case" ce qui est nécessaire pour ne pas rendre l’image floue. Ce décallage plus réduit signifie que la qualité du FSAA est elle aussi réduite. Il s’agit probablement d’un détail que Nvidia devrait pouvoir corriger puisque rien n’empêche d’utiliser une valeur différent en Quad SLI 8x et 16x.

Le SLI AA 16x est lui aussi différent du Quad SLI AA 16x puisque le premier combine 2 images calculées en 8xS contre 4 images en 4x pour le second. Ici aussi le positionnement des samples est en faveur du SLI AA 16x. Par contre il n’y a à priori pas de solution cette fois pour le Quad SLI à moins de proposer un mode AFR de SLI 16x à base d’image calculée en 8xS. Le Quad SLI 32x occupe plus au moins tout l’espace et affiche donc une bonne qualité. Par contre lorsque l’on y regarde de plus prêt il est évident que la différence par rapport au SLI 16x est réduite puisque le décalage entre les différentes samples est réduit ce qui au final ne devrait pas amener de gain énorme au niveau de la qualité alors qu’il réduira en théorie les performances par 2.

Le positionnement des samples de couleur dans les différents modes de SLI AA ne semble pas idéal pour permettre l´antialiasing des éléments tels que les objets rendus à partir de tests alpha (grillages) ou de pixel shader (vagues). Seuls les modes rendus à partir de combinaisons d´AA 8xS devraient en être capables, mais sans offrir une très grande qualité à ce niveau.

Le SLI antialiasing est fortement mis en avant par Nvidia avec le Quad SLI puisqu’il s’agit du mode le plus simple à mettre en place. Chaque GPU calcule une image entière et au final une seule image est composée : autrement pas de synchronisation complexe à gérer. Qu’en est-il du transfert des images ? Lui aussi il est plus simple quand dans les modes de rendu classique. Par exemple, dans le cas du Quad SLI 32x, le GPU 4 envoie son image au GPU 3 qui la mélange avec la sienne puis envoie le résultat au GPU 2 qui y mélange son image puis envoie le résultat au GPU 1 qui y mélange également son image et affiche ensuite le résultat final. Chaque GPU ne communique donc qu’avec un seul autre et ne prend en charge qu’un seul mélange. Tout aurait été bien plus complexe à gérer et moins performant si tous les GPU envoyaient leur image au GPU 1 qui se serait alors chargé de mélanger les 4 ensembles.

Page 3 - En pratique, les performances

En pratique

Nvidia nous a prêté pour quelques jours une machine Quad SLI d’un de leurs partenaires pour le lancement du Quad SLI en mars, LDLC. On en profite d’ailleurs pour signaler que malgré l’annonce dès le CeBIT d’une disponibilité imminente, les systèmes Quad SLI ne sont finalement pas encore disponibles dans le commerce en France et que ce n’est pas vraiment le cas non plus dans le reste de l’Europe. Ceci n’est pas plus mal étant donné qu’il faut toujours se méfier d’un produit disponible sans qu’il n’ait été possible à la presse de le tester.

Architecturée autour d’une carte mère ASUSTeK A8N-32SLI placée au sein d’un boîtier Coolermaster Stacker 830, la machine embarque notamment un Athlon 64 FX-60, 2 Go de PC3200 Corsair, 2 Raptor 74 Go et bien entendu 2 GeForce 7900 GX2 pour le Quad SLI. Le tout est alimenté par une alimentation Tagan capable de fournir selon le constructeur jusque 864W sur le +12V et 900W au total. Le tout devrait toutefois être remanié avec la sortie imminente des 7950 GX2 qui marquera la disponibilité réelle du Quad SLI.

Pour revenir sur l’alimentation, une telle puissance est-elle nécessaire ? En fait pas vraiment puisque l’on tourne plutôt à 300 Watts sur le bureau Windows et 550 Watts en charge maximale (CPU+4GPU). Malheureusement étant donné que la mode est aux alimentations séparant leur +12V en plusieurs lignes limitées chacune à un maximum de 20A et que deux GX2 ou une GX2 + CPU risque de consommer plus de 20A, il faut 3 lignes +12V séparées même si l’on risque d’avoir une sous utilisation de chaque ligne : les alimentations sans ce type de cloisonnement sont beaucoup plus flexibles de ce côté.

Le modèle Tagan parait donc un peu surdimensionné même si il a l’avantage de proposer d’office les 4 connecteurs PCI-Express. Il a malheureusement la particularité d’être l’élément le plus bruyant de la machine, devant les deux 7900 GX2, si bien que même en 2D la machine est très bruyante de son unique fait. On notera qu’en Quad SLI nous avons essuyé quelques plantages (machine gelée ou reboot inopiné), sans que l’on soit capable de déterminer si le problème venait spécifiquement des deux 7900 GX2, de la machine ou des drivers.

Enfin, il a fallu le tout dernier bios 1104 beta pour l’A8N-32SLI Deluxe afin de résoudre un problème assez handicapant : avec les deux Quad SLI et les bios précédents seuls 1280 Mo sur 2048 Mo de mémoire vive étaient utilisables.

Les performances

Nous avons essayé 11 jeux en Quad SLI : Half Life 2, Quake 4, Doom 3, Far Cry, Tomb Raider Legend, FEAR, Splinter Cell Chaos Theory, Age Of Empire 3, Oblivion, Colin Mc Rae 5 et Pacific Fighters. A partir de cet échantillon, nous avons pu voir qu’il y’avait deux comportements différents:

- Dans Doom 3 et FEAR, le passage de 2 à 4 GPU apporte des gains de performances quel que soit le réglage (tant que l’on n’est pas limité par le CPU bien entendu).
- Dans les autres jeux, le passage de 2 à 4 GPU n’apporte des gains de performances notables que lorsque l’on utilise des modes de SLI antialiasing (8x, 16x ou 32x).

Du coup plutôt que de vous montrer sur des pages et des pages cette situation sur tous les jeux testés nous avons préférer nous limiter à l’illustrer au travers de Doom 3, FEAR et Half Life 2 Lost Coast. Bien entendu nous serons plus prolixes lorsque le Quad SLI sera plus aboutie, à priori à l’arrivée des 7950 GX2 et des ForceWare 90.

Il faut noter que certains confrères ont réussi à avoir plus de jeux profitant du Quad SLI, mais ils disposaient non pas des ForceWare 87.25 mais des 87.24 : nos soucis viennent-t-ils de ces drivers, ou d’un problème hardware sur nos GX2 de test ? Malheureusement il nous est impossible d’en savoir plus à l’heure actuelle étant donné que nous ne disposons plus de 2 GX2.

Sous Doom 3 donc, les gains sont très importants même en dehors du SLI antialiasing puisqu’on atteint par exemple +91% en passant de 2 à 4 GPU en 2560*1600 avec AA 4x. Les chiffres des 7900 GTX SLI en AA 8x ne sont pas reportés ici comme sous les autres jeux du fait d’un manque de stabilité des performances avec les 87.25.

Les gains sous FEAR sont obtenus dès le 1920*1200, ce jeu étant beaucoup plus lourd graphiquement que Doom 3. Dans le meilleur des cas on gagne 72%, là encore en 2560*1600 avec AA 4x.

Enfin comme vous pouvez le voir sous Half Life 2 Lost Coast seul le mode SLI antialiasing 8x apporte un gain de performance, et note même de légères baisses de performances en 1920*1200 sans AA et en AA 4x. Le gain en AA 8x est certes important, mais en soit peu utile pour un possesseur de 30" : on peut passer du 4x au 8x sans baisse importante de performance mais étant donné que les performances n’étaient pas assez importantes en 4x l’intérêt est de fait inexistant.

Bien entendu tout ceci laisse penser que Nvidia n’a pas encore vraiment optimisé les drivers actuels, ici les 87.25, pour le Quad SLI étant donné le faible nombre de jeux en tirant partie. Le fait que Doom 3 en profite et pas Quake 4 est d’ailleurs assez parlant de ce côté, sans être forcément rassurant.

En poussant un peu plus nos recherches et en passant outre les profils SLI, nous avons pu constater que les modes Quad AFR, Quad SFR et AFR de SFR étaient bien intégrés dans les drivers mais une fois que nous avons essayé de les utiliser, nous n’avons pu observer que des performances médiocres en dehors des tests de fillrate ce qui confirme que le développement du Quad SLI est encore en plein chantier et loin d’être pleinement fonctionnel avec les drivers actuels.

Page 4 - En pratique, le SLI antialiasing

Le SLI antialiasing

Nous avons pris des screenshots dans Half-Life 2 afin de représenter la qualité en pratique des différents modes. Notez que les petites branches et feuilles des arbres sont rendues à partir de test alpha et ne sont donc antialiasées que lorsque le Transparency AntiAliasing est activé ou lorsque le mode d’antialiasing utilise plusieurs samples de couleur. Comme nous l’avions pressenti en observant le positionnement des samples et comme vous pouvez le voir ici, les modes SLI 8x, Quad SLI 8x et Quad SLI 16x ne permettent pas en pratique de filtrer les objets rendus à partir de tests alpha, l’eau rendue à partir de shaders etc. Les modes SLI 16x et Quad SLI 32x filtrent, eux, ces éléments mais uniquement au niveau du FSAA 8xS et ne profitent pas de leurs samples de couleur supplémentaires.

Sans antialiasing.

De gauche à droite : AA 4X, SLI AA 8X, Quad SLI AA 8X, SLI AA 16X, Quad SLI AA 16X, Quad SLI AA 32X.

Idem mais avec le transparency antialiasing activé.
Comme vous pouvez le constater, les différences sont faibles entre les différents modes à l’exception de l’activation du TAA qui apporte un plus significatif. Bien entendu, lorsque l’on y regarde de près, l’antialiasing 32x est celui qui affiche la meilleure qualité une fois couplé au TAA (les objets rendus à partir de tests alpha bénéficiant alors d’un antialiasing de type supersampling 32x !). Mais est-ce que cela vaut le coup compte tenu des performances ?

Mesurées sur notre démo dans Lost Coast et en 1600 x 1200, les performances en antialiasing tranchent clairement en faveur du mode 4x. Bien entendu, en 8x le Quad SLI est tout aussi performant mais cela est dû uniquement au fait que les drivers ne lui permettent pas encore de s’exprimer réellement en dehors des modes de SLI antialiasing. En pratique et quand les drivers seront prêts, le Quad SLI montrera de l’intérêt pour jouer en FSAA 4x en 2560 x 1600. Le coût du Quad SLI n’est selon nous pas justifié simplement pour passer du FSAA 4x au FSAA 8x. Quand au mode 32x, quelle est son utilité ? Jouer en 1024 x 768 au lieu des hautes résolutions mais avec une qualité de FSAA légèrement supérieure ? Il est possible de profiter de ce petit gain de qualité dans les vieux jeux tout en restant en haute résolution mais ici aussi le coût semble difficilement justifié.

Selon nous, dans le cadre d’une utilisation ludique, le mode le plus approprié est le FSAA 4x avec Transparency AntiAliasing. Bien que les autres modes puissent augmenter la qualité, ce n’est pas dans une proportion qui justifie la perte de performances et/ou le surcoût.

Page 5 - Conclusion

Conclusion

Elitiste, la solution Quad SLI de Nvidia offre d’importants gains de performances ... à partir du moment où l’on utilise des jeux ou des réglages bien précis. En effet, en l’état actuel des choses très peu de jeux tirent profit du Quad SLI sans un mode de SLI antialiasing (8x, 16x, 32x). Du coup, si dans les rares jeux où c’est le cas les gains sont prometteurs, dans les autres on a du mal à apprécier le fait que l’AA 8x soit quasi gratuit par rapport au 4x et de fait quasiment deux fois plus rapide que sur une solution bi GPU : si le jeu ramait déjà en 4x, quel intérêt de le voir ramer en 8x sur votre 30" à 2000 € ? Il en va de même pour les modes 16x et 32x qui, qui plus est, affichent un gain qualitatif à l’opposé de leur influence sur les performances.

Les connecteurs entre les deux GX2

Si en soit le fait de passer de 2 à 4 GPU a, contrairement à ce que certains pourraient penser, une utilité théorique, il reste du travail à Nvidia pour que cette utilité se vérifie plus régulièrement en pratique. Nvidia promet de nombreuses avancées pour le Quad SLI via la génération de ForceWare 90, et les 7950 GX2 ne sortent dans tous les cas que dans un mois : si d’ici là les gains obtenus sous FEAR ou Doom 3 sont étendus à tous les jeux qui tirent déjà partie du SLI, le Quad SLI deviendra de fait la solution idéale pour les joueurs fortunés visant la très haute résolution.

En attendant, on peut se demander ce qui a pris Nvidia d’annoncer si tôt le Quad SLI : pour rappel les Quad SLI à base 7800 réservées à Dell ont été annoncées en janvier et les Quad à base de 7900 destinées à l’intégration l’on été en mars, avec une soi-disant disponibilité immédiate. Heureusement, ce ne fût pas vraiment le cas, sans quoi plus d’un acheteur aurait eu du mal à avaler l’onéreuse pilule que représente un Quad SLI beta !