AMD Radeon HD 6970 & 6950, seules et en CrossFire X - version imprimable

AMD Radeon HD 6970 & 6950, seules et en CrossFire X
Cartes Graphiques
Publié le Mercredi 15 Décembre 2010 par Damien Triolet

URL: /articles/813-1/amd-radeon-hd-6970-6950-seules-crossfire-x.html

Page 1 - Introduction

Après quelques semaines de retard, les Radeon HD 6900 débarquent enfin et introduisent Cayman, une évolution du GPU des Radeon HD 5800 destiné à placer la barre plus haut en termes de performances. De quoi rivaliser avec les GeForce GTX 500 ?

Pas vraiment…

Lors de la présentation finale des Radeon HD 6900, AMD annonce directement la couleur : la GeForce GTX 580 est hors de portée.

Ceci en décevra plus d’un puisque nombreux pensaient voir AMD devancer Nvidia avec un GPU plus performant. AMD y croyait d’ailleurs probablement aussi mais a dû revoir ses ambitions à la baisse. En cause peut-être une nouvelle architecture dont il s’est avéré plus complexe que prévu de tirer le meilleur mais surtout la sortie d’excellentes GeForce GTX 500 qui a contrarié les plans initiaux.

Heureusement, AMD est très pragmatique au niveau du positionnement tarifaire et a décidé une nouvelle fois d’attaquer Nvidia sur le plan du rapport performances prix avec une Radeon HD 6970 proposée à 330€ contre 350€ pour la GeForce GTX 570. Quant à la Radeon HD 6950 proposée à 270€, elle se retrouve sans concurrente directe… en dehors de la Radeon HD 5870.

Page 2 - Cayman

Cayman

Avec Cayman, AMD a pris un risque en décidant de revoir un aspect de l’architecture de ses unités de calcul qui n’avait pas évolué depuis la Radeon HD 2900 XT. D’une manière simplifiée, nous caractérisons les unités de calcul d’AMD de vec5, ce qui signifie qu’elles sont capables d’exécuter jusqu’à 5 instructions en parallèle. Cependant, avec une telle architecture, si le code à exécuter ne permet pas de paralléliser autant d’instructions, elles ne seront pas pleinement exploitées, à l’inverse de l’architecture scalaire de Nvidia qui peut maintenir un rendement élevé dans un maximum de situations. Deux approches tout aussi valides l’une que l’autre.

Attention à ne pas confondre unité de calcul avec « core », une notion marketing utilisée par Nvidia pour se comparer aux CPUs et suivie par AMD qui en profite pour compter 5 cores par unités de calcul vec5. Globalement vous pouvez voir les choses sous 2 angles : une unité vec5 d’AMD est plus efficace qu’une unité scalaire de Nvidia ou un core d’AMD est moins efficace qu’un core Nvidia.

Gros plan sur une unité de calcul vec5 de Cypress.

Gros plan sur une unité de calcul vec4 de Cayman.
Avec le GF104 des GeForce GTX 460, ainsi que ses dérivés, Nvidia s’est rapproché d’un fonctionnement vectoriel pour augmenter le rendement… et AMD entend faire de même avec Cayman, mais dans l’autre sens, en passant de vec5 à vec4. Les unités de calcul de Cayman sont ainsi moins puissantes que celle des précédents GPU d’AMD, mais elles sont statistiquement plus efficaces, mais pas plus performantes, la nuance est importante. Par contre en étant plus simples, ces unités occupent moins de place et consomment moins, ce qui permet d’en augmenter le nombre, tout autre chose restant égale.

Plus en détail, les précédents GPUs Radeon reposaient sur des unités de calcul de type 4+1, avec une ligne d’exécution capable de prendre en charge les instructions complexes. C’est ce « +1 » dont AMD a décidé de se débarrasser. En contrepartie ces instructions complexes doivent être traitées sur les autres lignes via une succession d’opérations plus simples. Ces instructions monopoliseront ainsi 3 des 4 lignes d’exécution, ce qui les rendra bien plus gourmandes puisque seule une instruction simple pourra être exécutée en parallèle contre 4 auparavant.

Sans ce « +1 » un peu spécial et dans certains cas difficile à alimenter correctement, le compilateur va voir sa tâche grandement simplifiée, ce qui pourra même dans quelques cas rendre ces unités vec4 plus performantes que les précédentes vec5 mais globalement AMD a maintenant besoin de plus d’unités de calcul vec4 pour maintenir un même niveau de performances.

Alors que Cypress, le GPU des Radeon HD 5800, disposait de 20 blocs de 16 unités de calcul vec5, Cayman dispose de 24 blocs de 16 unités de calcul vec4. Nous avons donc affaire à 320 unités vec5 contre 384 unités vec4, ce qui est moins flatteur une fois transposé en « cores » puisque cela nous donne 1536 cores « seulement » pour Cayman contre 1600 pour Cypress. Un détail important se retrouve cependant au niveau des unités de texturing dont le nombre est fixé à 4 par bloc. Cayman voit donc sa puissance à ce niveau augmenter de 20% à fréquence égale. Notez qu’AMD indique avoir augmenté le débit de calcul en double précision, mais il s’agit d’une manière tordue d’interpréter le fait que le « +1 » ne prenait pas en charge la double précision. Une unité de Cayman est identique à une unité de Cypress à ce niveau.

AMD ne s’est pas arrêté là et à introduit d’autres petites améliorations à son architecture. La première concerne le traitement de la géométrie qui se voit parallélisé de manière à casser la limite d’un triangle par cycle. Attention cependant, il est parallélisé mais pas distribué au niveau des blocs d’unités de calcul contrairement à ce qui se passe du côté des GeForce. Voici une manière simplifiée de voir les choses :

Cypress : 1 unité complexe de traitement géométrique -> 1 triangle de 32 pixels par cycle,
Cayman : 2 unités complexes de traitement géométrique -> 2 triangles de 16 pixels par cycle
GF100/GF110 : 16 unités simples de traitement géométrique -> 4 triangles de 8 pixels par cycle

Nvidia conserve donc un avantage avec les petits triangles et surtout, avec plus d’unités simples de traitement géométrique, évite un engorgement au niveau du GPU lorsque de très nombreuses données sont générées par la tessellation. Pour combattre ce problème, AMD a élargi le buffer dédié dans Barts, le GPU des Radeon HD 6800, et Cayman et va plus loin avec ce dernier qui est capable de transférer toutes ces données temporairement dans la mémoire vidéo pour éviter de bloquer tout le GPU. Cette fonction n’est cependant pas directement exposée et nous ne savons pas si elle s’enclenche automatiquement lors de certaines charges ou si AMD doit y avoir recours manuellement au cas par cas.

AMD a également amélioré ses ROPs pour augmenter le débit des formats 16 bits entiers et 32 bits flottants. Ils gagnent également en efficacité avec l’antialiasing, ainsi que lors de l’écriture en mémoire en mode « compute ». A ce sujet, AMD s’est inspiré de ce que propose Nvidia et permet l’exécution simultanée de plusieurs kernels différents alors qu’auparavant le GPU devait leur attribuer des périodes d’exécution successives. Il en va de même pour la communication avec le CPU qui pourra se faire dans les deux sens en même temps grâce à 2 moteurs DMA, comme le GF100/110. Les contrôleurs mémoire ont par ailleurs été revus pour pouvoir supporter plus facilement de la GDDR5 rapide.

Cayman : 2.64 milliards de transistors
Enfin, AMD a franchi un pas important en intégrant, pour la première fois dans un GPU, une unité chargée de contrôler sa consommation. Via des centaines de capteurs répartis dans tous les blocs du GPU, Cayman est capable de connaître sa consommation et de s’autolimiter au niveau de la fréquence pour rester dans la consommation maximale définie. AMD parle d’une granularité d’une frame. Une précision et une réactivité qui n’a donc rien de comparable à ce que Nvidia propose avec les GeForce GTX 500. Cayman se comporte ici d’une manière similaire à celle des CPUs récents si ce n’est qu’il ne dispose pas de fonction Turbo qui lui permettrait d’augmenter sa fréquence lorsque la consommation est inférieure à la limite. Cette technologie, nommée PowerTune, devrait se généraliser dans tous les futurs GPUs d’AMD et prendra tout son intérêt dans le monde mobile !

Tous ces changements ont gonflé le nombre de transistors de Cayman qui passe de 2.15 à 2.64 milliards, soit une augmentation de 23% qui se retrouve également au niveau de la taille du die qui passe, elle, de 334 à 389mm². Une augmentation de 16% seulement qui indique que la densité des transistors est maintenant supérieure.

Page 3 - Spécifications, les cartes

Spécifications

Avec une fréquence GPU légèrement plus élevée, la Radeon HD 6970 affiche une puissance de calcul presqu’identique à celle de la Radeon HD 5870. Elle profite par contre d’un débit de triangles et de filtrage plus important. Bonne nouvelle, la Radeon HD 6950 est moins castrée par rapport à la Radeon HD 6970 que ne l’était la Radeon HD 5850 par rapport à la Radeon HD 5870.

Les Radeon HD 6900 de référence

Pour ce test, AMD nous a fourni une Radeon HD 6970 ainsi qu’une Radeon HD 6950 de référence. Les deux cartes sont identiques comme vous pouvez le constater :

Ce deux nouvelles Radeon partagent autant le système de refroidissement que le PCB et son étage d’alimentation. De petites différences sont visibles à son niveau mais il ne s’agit que de détails de révision et de fabrication, les deux PCBs ne sortant visiblement pas de la même usine. Il est cependant possible que les Radeon HD 6950 du commerce, surtout une fois les premiers lots écoulés soient légèrement modifiées puisque d’une manière évidente elles n’ont pas besoin d’un étage d’alimentation aussi costaud. Elle se contente d’ailleurs de 2 connecteurs d’alimentation 6 broches contre 8+6 pour la Radeon HD 6970.

En plus d’utiliser de la GDDR5 très rapide, de marque Hynix certifiée à 6 Gbps soit 1.5 GHz pour son pilotage et 3 GHz pour l’envoie des données, AMD a décidé de placer pas moins de 2 Go par défaut sur les Radeon HD 6900.

Pour le reste il s’agit d’un design AMD « classique » avec une turbine et une chambre à vapeur. Comme la Radeon HD 5870 mais contrairement à la Radeon HD 5850, une plaque en aluminium recouvre l’arrière du PCB.

Au niveau de la connectique, AMD a repris celle introduite avec les Radeon HD 6800, à savoir 2 sorties DVI Dual-Link, une sortie HDMI et 2 sorties mini-DisplayPort. Le tri et le quad CrossFire X est supporté via 2 connecteurs dédiés. A côté de ceux-ci, AMD a mis en place un petit switch qui permet d’enclencher un bios de secours. Le premier bios peut être flashé par l’utilisateur, alors que le second est protégé, ce qui permet d’éviter tout problème lors d’une mise à jour.

La consommation maximale autorisée est fixe à 250W pour la Radeon HD 6970 et à 200W pour la Radeon HD 6950. Si le GPU estime que la consommation de la carte va au-delà, il réduit progressivement sa fréquence via la technologie PowerTune. AMD précise cependant avoir fixé les limites de ces cartes de manière à ce que cette protection ne s’enclenche pas dans les jeux les plus gourmands et dans les pires situations, c’est-à-dire avec un exemplaire du GPU aux courants de fuites élevés placé dans un environnement très chaud.

Il est possible de modifier cette limite de consommation via le panneau Overdrive des Catalyst. AMD permet de l’ajuster entre -20 et +20%, soit entre 200 et 300W pour une Radeon HD 6970. La réduire permet de limiter la consommation et les nuisances dans les jeux les situations les plus gourmandes alors que l’augmenter permet de disposer de plus de marge pour l’overclocking sans quoi une augmentation de fréquence pourrait ne rien changer si le GPU se limite à son niveau.

Page 4 - Consommation, bruit

Consommation

Nous avons bien entendu utilisé le protocole de test qui nous permet de mesurer la consommation de la carte graphique seule. Nous avons effectué ces mesures au repos, sous 3D Mark 06 et sous Furmark. Notez que nous utilisons une version de Furmark non-détectée par le mécanisme de limitation de la consommation dans les stress tests mis en place par Nvidia dans les pilotes pour les GeForce GTX 500.

Au repos, les nouvelles Radeon affichent une consommation identique à celle de la génération précédente. En charge la Radeon HD 6970 est similaire à une Radeon HD 5870 2 Go alors que la Radeon HD 6950 consomme 10 à 20W de plus que la Radeon HD 5850.

Attention cependant, autant dans 3DMark06 que dans Furmark, les Radeon HD 6900 ont réduit leur fréquence (elle varie par exemple entre 570 et 700 MHz au lieu de 880 MHz pour la Radeon HD 6970) ce que nous ne comprenons pas puisque la limite est censée être de 250 et de 200W et non de 210 et 160W comme cela semble être le cas dans ces applications. AMD aurait-il ajouté une limitation supplémentaire pour certaines applications ? Celles utilisées par les testeurs pour mesurer la consommation ? PowerTune pourrait-il être induit en erreur dans certains cas sur la consommation réelle ? Nos questions à ce sujet sont restées sans réponse chez AMD…

Nuisances sonores

Nous plaçons les cartes dans un boîtier Antec Sonata 3 et mesurons le bruit d'une part au repos et d'autre part en charge. Le sonomètre est placé à 60cm du boîtier.

Si les Radeon HD 6900 restent silencieuses au repos, en charge elles sont plus bruyantes que les cartes de la génération précédente. Elles produisent également des nuisances quelque peu plus gênantes puisque la vitesse de leur turbine varie par à coups. Voici les variations que nous avons notées :

HD 6950 : 44.6 dB -> 47.1 dB
HD 6970 : 47.6 dB -> 48.9 dB
HD 6950 CFX : 52.7 dB -> 54.1 dB
HD 6970 CFX : 53.7 dB -> 56.4 dB

Nous avons bien entendu retenu la valeur la plus élevée de cette fourchette. Au final, Nvidia est parvenu à retourner la situation à son avantage, particulièrement en SLI où 2 GeForce GTX 570 sont nettement moins bruyantes que 2 Radeon HD 6970.

Page 5 - Températures

Températures

Toujours placées dans le même boîtier, nous avons relevé la température du GPU rapportée par la sonde interne :

Les Radeon HD 6900 chauffent un petit peu plus que les Radeon HD 5800, ce qui laisse moins de marge pour essayer de calibrer le système de refroidissement de manière à réduire les nuisances sonores.

Voici ce que cela donne en image grâce à la thermographie infrarouge :

Radeon HD 6950 au repos

Radeon HD 6970 au repos

Radeon HD 6950 CrossFire X au repos

Radeon HD 6970 CrossFire X au repos

Radeon HD 6950 en charge

Radeon HD 6970 en charge

Radeon HD 6950 CrossFire X en charge

Radeon HD 6970 CrossFire X en charge
Vous pourrez retrouver plus de détails dans notre dossier consacré au dégagement thermique des cartes graphiques de référence.

Page 6 - Tests théoriques : pixels

Performances texturing

Nous avons mesuré les performances lors de l’accès à des textures de différents formats en filtrage bilinéaire. Nous avons conservé les résultats en 32 bits classique (8x INT8), en 64 bits "HDR" (4x FP16) et en 128 bits (4x FP32). Nous avons ajouté les performances en 32 bits RGB9E5, un nouveau format HDR introduit par DirectX 10 qui permet de stocker des textures HDR en 32 bits avec quelques compromis.

Comme annoncé par Nvidia, les GeForce GTX 500 sont capables de filtrer les textures FP16/11/10 et RGB9E à pleine vitesse et sont à ce niveau respectivement 2.35x et 2.58x plus performantes que les GeForce GTX 480 et 470.

Les Radeon HD 6900 disposent cependant d’une puissance de filtrage tellement supérieure, que même si elles doivent filtrer les textures FP16 à demi-vitesse, elles affichent des débits proches des GeForce.

Notez que nous avons dû augmenter la limite de consommation des Radeon HD 6900 au maximum sans quoi les fréquences étaient réduites dans ce test. De base, ces nouvelles Radeon semblent donc incapables de profiter pleinement de toute leur puissance de texturing !

Fillrate

Nous avons mesuré le fillrate sans et puis avec blending, et ce avec différents formats de données :

En terme de fillrate, les Radeon ont un gros avantage sur les GeForce GTX 400/500, surtout en FP10, format traité à pleine vitesse alors que sur les GeForce il passe à demi vitesse. Compte tenu de la limitation de ces GeForce au niveau des datapaths entre les SMs et les ROPs, il est dommage que Nvidia n’ait pas donné à ses GPUs la possibilité de profiter des formats FP10 et FP11.

Comme les GeForce, les Radeon HD 6900 sont capables de traiter le FP32 simple canal à pleine vitesse sans blending, elles conservent par contre ce débit avec blending.

Page 7 - Tests théoriques : géométrie

Débit de triangles

Etant donné les différences architecturales des GPUs récents au niveau du traitement de la géométrie, nous nous sommes évidemment penchés de plus près sur le sujet. Tout d’abord nous avons observé les débits de triangles dans deux cas de figure : quand tous les triangles sont affichés et quand ils sont tous rejetés (parce qu’ils tournent le dos à la caméra) :

AMD a bel et bien doublé le débit de triangle avec ses Radeon HD 6900 qui devancent aisément les GeForce lorsqu’il s’agit d’afficher réellement ces triangles, Nvidia ayant bridé ces dernières pour donner un avantage aux Quadros. Dès qu’il s’agit d’éjecter des triangles du rendu via le culling, aucune Radeon n’arrive cependant à concurrencer les GeForces haut de gamme.

Ensuite nous avons effectué un test similaire mais en utilisant la tessellation :

L’avantage des GeForces sur les Radeons est ici évident. AMD et Nvidia ont des approches très différentes et les GeForces affichent un débit qui varie suivant le nombre d’unités de traitement de la carte.

L’architecture des Radeons fait qu’elles sont rapidement engorgées par la quantité de données générées, ce qui réduit drastiquement leur débit dans ce cas. Le doublement de la taille du buffer dédié à l’unité de tessellation dans le GPU des Radeon HD 6800 leur permet d’être significativement plus performantes que les Radeon HD 5800, et la parallélisation du traitement géométrique permet aux Radeon HD 6900 de revenir encore un peu sur les GeForce, mais pas de les égaler.

Etrangement, la GeForce GTX 580 n’affiche qu’un gain très faible sur la GeForce GTX 480 et est même moins performante dans ce test lorsque les triangles sont éjectés du rendu via culling. Cela peut être lié à une configuration logicielle différente qui favorise certains cas (les plus importants probablement) mais peu entraîner une baisse dans d’autres (nous avions déjà pu observer cela avec certains profils des Quadros). Dans tous les cas, ce phénomène ne se retrouve pas sur la GeForce GTX 570 qui se comporte dans ce cas comme une GeForce GTX 480 aux fréquences boostées. Notez que nous avons bien entendu retesté la GeForce GTX 580 avec le même pilote que la GeForce GTX 570.

Displacement mapping

Nous avons testé la tessellation avec une démo d’AMD intégrée par Microsoft à son SDK de DirectX. Cette démo permet de comparer le bump mapping, le parallax occlusion mapping (la technique de bump mapping la plus avancée utilisée dans les jeux) et le displacement mapping qui exploite la tessellation.

Le bump mapping basique.

Le parallax occlusion mapping.

Le displacement mapping avec tessellation adaptative.
En créant de la vraie géométrie supplémentaire, le displacement mapping affiche une qualité nettement supérieure. Nous avons activé ici l’algorithme adaptatif par rapport à la distance qui permet d’éviter de générer de la géométrie inutile et trop de petits triangles qui ne vont pas remplir un quad, la zone de rendu minimale sur tous les GPUs et donc gâcher beaucoup de puissance de calcul.

Nous avons mesuré les performances obtenues avec les différentes techniques :

Il est intéressant de remarquer que la tessellation ne se contente pas d’améliorer la qualité du rendu, mais également les performances ! Le parallax occlusion mapping est en fait très gourmand puisqu’il repose sur un algorithme complexe qui essaye de simuler la géométrie d’une manière réaliste. Malheureusement il génère beaucoup d’aliasing et le trucage est vite démasqué aux bords des objets ou des surfaces qui l’utilisent.

Notez cependant que dans le cas présent l’algorithme de displacement mapping est bien aidé par le fait qu’il s’agit d’une surface plane à la base. S’il faut lisser les contours de la géométrie et en même temps appliquer le displacement mapping, le coût sera bien entendu plus élevé.

Les GeForce encaissent ici beaucoup mieux la charge liée à la tessellation que les Radeon et étrangement les Radeon HD 6900 n’apportent ici qu’un gain modéré proche de celui apporté par les Radeon HD 6800.

L’utilisation d’un algorithme adaptatif qui va réguler le niveau de tessellation suivant les zones qui vont recevoir plus ou moins de détails, suivant la distance ou encore suivant la résolution de l’écran permet dans tous les cas des gains significatifs et nous semble plus représentatif de ce que vont faire les développeurs. L’écart entre les GeForce et les Radeon se réduit alors, et ces dernières passent même devant dans certains cas.

Page 8 - AMD sacrifie la qualité ?

AMD sacrifie la qualité ?

Avec l’arrivée des Radeon HD 6800 et des Catalyst 10.10 betas, AMD a décidé de revoir en partie le fonctionnement de Catalyst A.I., cette option du pilote qui s’occupe d’activer certaines optimisations génériques ainsi que les optimisations spécifiques à chaque jeu.

Auparavant il n’était possible d’activer que certaines optimisations plus agressives au niveau du filtrage ou de désactiver complètement Catalyst A.I. et l’ensemble des optimisations apportées par AMD. Dorénavant, il est possible de paramétrer les optimisations du filtrage des textures indépendamment. Par défaut, un mode « qualité » est activé, qui intègre cependant des optimisations quelque peu plus agressives qu’auparavant, ce qui introduit plus de fourmillement dans certaines textures et baisse donc la qualité. Lors de la présentation des Radeon HD 6900, AMD nous a indiqué ne pas avoir l’intention de revenir en arrière à ce niveau. Par contre un compromis intermédiaire pourrait voir le jour.

Notez que la base du problème n’est pas liée à ces optimisations logicielles, mais, nous le supposons, à un sous-échantillonnage pratiqué par les unités de texturing, soit à une optimisation matérielle. Par contre les optimisations logicielles introduites amplifient le phénomène de fourmillement.

Afin d’observer le gain apporté par ces optimisations que nous jugeons trop agressives, et qui réduisent la qualité là où Nvidia avait déjà un léger avantage, nous avons mesuré les performances sur l’ensemble de notre protocole de test une Radeon HD 6970 et les 2 modes de qualité du filtrage des textures :

Suivant les jeux, le gain de performances varie entre 0 et 6% avec un gain moyen de 1 à 1.4%. Notez que ce gain moyen correspond à l’influence de l’optimisation sur notre indice de performances. Elle est donc relativement modérée et ne change donc pas nos conclusions quant aux performances de ces produits puisque ce n’est pas pour 2% de performances en plus ou en moins que nous vous conseillons un modèle plus qu’un autre.

Notez que lors de nos tests nous nous contentons du niveau de filtrage maximal proposé directement par les jeux et ne forçons donc pas le filtrage anisotrope 16x dans le panneau de contrôle des pilotes. Si cela avait été le cas, l’influence de ces optimisations sur les résultats aurait en toute logique été plus importante.

En 2010, rien ne justifie de sacrifier ainsi la qualité graphique proposée par défaut et nous espérons qu’AMD rectifiera le tir avec de futurs pilotes. Dans tous les cas vous aurez compris que c’est le mode « haute qualité » que nous utiliserons pour ce test.

Page 9 - Antialiasing, le test

Antialiasing

Avec les Radeon HD 6900, AMD introduit un nouveau mode d’antialiasing qui est cette fois lié au hardware et ne sera donc pas rendu disponible sur les autres GPUs. Ce nouveau mode se nomme EQAA et est un clone du CSAA de Nvidia qui permet de pondérer plus précisément le poids des différentes samples dans certains cas, ce qui permet de s’approcher de la qualité du niveau d’antialiasing supérieur.

AMD 4x = Nvidia 4x
AMD 4xEQ = Nvidia 8x
AMD 8x = Nvidia 8xQ
AMD 8xEQ = Nvidia 16xQ

Comme Nvidia, AMD introduit également une option « Enhance application settings ». Avec les Radeon, cette option va ajouter l’EQAA à l’antialiasing activé dans le jeu.

Le test

Pour ce test, nous avons repris le même protocole que celui utilisé dans le test de la GeForce GTX 580 si ce n’est que nous n’avons pas conservé H.A.W.X. 2. Après avoir pu observer le jeu en lui-même, décevant tant sur le gameplay que sur l’aspect graphique, il nous a semblé inutile de le conserver. En dehors des terrains détaillés, le rendu est plus que pauvre, globalement moins réussi que dans le premier volet. Il n’y a donc pas de raison de nous encombrer de ce logiciel aux choix techniques partisans qui en fin de compte ne nous en apprend pas plus que les tests théoriques dédiés à la tessellation.

Les tests ont été exécutés d’une part en 1920x1200, sans FSAA, avec MSAA 4x et avec MSAA 8x. D’autre part nous avons exécutés de tests en bi-GPU haut de gamme en 1920 MSAA 4x, 8X et en 2560 MSAA 4x. Nous avons donc grossièrement séparé le haut de gamme et l’ultra haut de gamme dans des graphes différents avec des exceptions pour Far Cry 2 et Crysis Warhead qui ont été testés en 1920 et en 2560, sans AA, avec MSAA 4x et avec MSAA 8x.

Notez à ce sujet que nous nous sommes bien assurés de tester ce mode sur les GeForce, ce qui n’est pas toujours évident. Dans les pilotes Nvidia, l’antialiasing 8x est un fait du MSAA 4x avec un CSAA 8x qui n’offre pas la même qualité qu’un MSAA 8x, qui est, lui, appelé antialiasing 8xQ. C’est donc bien celui-ci qui a été testé.

Un an après sa sortie, nous avons décidé de ne plus placer DirectX 11 à part, d’autant plus que toutes les cartes testées ici sont compatible avec cette API. Jeux DirectX 11, 10 et 9 sont donc mélangés et nous avons opté pour un niveau de détails très élevé même dans les jeux les plus gourmands. Les dernières mises à jour ont été installées et toutes les cartes ont été testées avec les derniers pilotes disponibles.

Nous avons décidé de ne plus afficher les décimales dans les résultats de performances dans les jeux pour rendre le graphique plus lisible. Ces décimales sont néanmoins bien notées et prises en compte pour le calcul de l’indice. Si vous êtes observateurs vous remarquerez que c’est également le cas pour la taille des barres dans les graphes.

Les Radeon ont été testée avec le filtrage des textures réglé sur « haute qualité ». Toutes les Radeon ont été testées avec le pilote beta 8.79.6.2RC2 et les CAP1 des Catalyst 10.12.

Configuration de test

Intel Core i7 975 (HT et Turbo désactivés)
Asus Rampage III Extreme
6 Go DDR3 1333 Corsair
Windows 7 64 bits
Forceware 263.09
Catalyst beta 8.79.6.2RC2 + CAP1 (Catalyst 10.12)

Page 10 - Need for Speed Shift

Need for Speed Shift

Pour tester Need for Speed Shift, nous poussons toutes les options à leur maximum et effectuons un déplacement bien défini. Le patch 1.1 est installé.

Notez qu’AMD a mis en place une optimisation qui remplace certaines surfaces de rendu HDR 64 bits par d’autres en 32 bits. Nvidia crie bien sûr à la triche, mais cela ne nuit pas à la qualité. En réalité, AMD profite ici d’une particularité de son architecture qui est capable de traiter ces formats de HDR 32 bits à pleine vitesse. Les GeForce peuvent cependant également en profiter et Nvidia a fourni à la presse un petit outil qui permet de la mettre en place pour obtenir des mesures de performance comparables.

Dans ce premier test, les Radeon HD 6900 apportent un gain significatif sur les Radeon HD 5800.

Les systèmes multi-GPU haut de gamme sont ici limités par le CPU.

Page 11 - ArmA 2

ArmA 2

Pour tester ArmA 2, nous effectuons un déplacement bien défini après avoir chargé une sauvegarde. Nous utilisons le niveau de détails « élevé » du jeu (visibilité à 2400m) en plus duquel nous poussons toutes les options avancées au niveau très élevé.

ArmA 2 est particulier au niveau de la résolution puisqu’il permet de paramétrer différemment la résolution de l’interface de celle du rendu 3D qui est ramenée à hauteur de la première via un filtre. De notre côté nous utilisons une résolution de rendu identique à celle de l’affichage.

Les paramètres proposé pour l’antialiasing dans le jeu sont peu clairs et différents entre les cartes AMD et Nvidia. Du côté d’AMD, 3 modes sont proposés : faible, moyen et élevé. Ils correspondent au MSAA 2x, 4x et 8x. Du côté Nvidia, ça se complique :

- faible et moyen = MSAA 2x
- élevé et très élevé = MSAA 4x
- 5 = MSAA 4x + CSAA 8x (appelé 8x dans les pilotes Nvidia)
- 6 = MSAA 8x (appelé 8xQ dans les pilotes Nvidia)
- 7 = MSAA 4x + CSAA 16x (appelé 16x dans les pilotes Nvidia)
- 8 = MSAA 8x + CSAA 16x (appelé 16xQ dans les pilotes Nvidia)

Le patch 1.5 a été installé.

Etrangement, avec les derniers pilotes en date, les performances baissent légèrement pour toutes les Radeon. Les Radeon HD 6900 ne sont pas à la fête et terminent ici derrière les Radeon HD 5870 et 6870.

Petit avantage aux GeForce dont la limite CPU semble légèrement moins élevée.

Page 12 - Starcraft 2

Starcraft 2

Pour tester Starcraft 2, nous lançons un replay et mesurons les performances en suivant la vue d’un des joueurs.

Toutes les options graphiques sont poussées au maximum. Le jeu n’intègre pas de support de l’antialiasing qui est donc activé par les panneaux de contrôle des pilotes AMD et Nvidia. Le patch 1.0.3 est installé.

Notez la meilleure efficacité des Radeon avec AA8x.

Les systèmes multi-GPU haut de gamme sont ici limités par le CPU.

Page 13 - Mafia II

Mafia II

Le moteur de Mafia II confie la gestion de la physique aux bibliothèques PhysX de Nvidia et en profite pour proposer un niveau de détails physiques élevé qui peut être partiellement accéléré par les GeForce.

Pour mesures les performances, nous utilisons les benchmark intégré et toutes les options graphiques sont poussées à leur maximum tout d’abord sans activer les effets PhysX accélérés par le GPU :

La Radeon HD 6970 devance la Radeon HD 5870 d’une dizaine de pourcents.

Ensuite, nous passons les détails PhysX à leur niveau élevé :

Avec les effets PhysX poussés au maximum, les performances plongent. Notez qu’elles sont en partie limitées par le CPU, tous les effets PhysX supplémentaires n’étant pas accélérés. Les Radeon restent bien entendu derrière.

Page 14 - Crysis Warhead

Crysis Warhead

Crysis Warhead a remplacé Crysis dont il reprend le moteur graphique très gourmand à tous les niveaux. Nous le testons dans sa version 1.1 hotfix et en mode 64 bits puisque c’est la principale nouveauté apportée. Crytek a renommé les différents modes de qualité graphique, probablement pour ne pas heurter les joueurs déçus de ne pas pouvoir activer le mode très haute qualité pour cause de gourmandise excessive. Le mode haute qualité est ainsi renommé « Gamer », et le mode très haute qualité « Enthousiast », c’est celui que nous avons testé.

Les Radeon HD 6900 se comportent ici plutôt bien par rapport aux GeForce et au fur et ç mesure que la qualité augmente, la Radeon HD 6970 se rapproche de la GeForce GTX 580.

Page 15 - Far Cry 2

Far Cry 2

La suite de Far Cry n’en est pas réellement une puisque Crytek était à l’origine du premier épisode. La licence appartenant à Ubisoft c’est ce dernier qui s’est chargé de son développement, Crytek optant alors pour Crysis. Pas facile de reprendre l’héritage de révolution graphique qui accompagne Far Cry, mais les équipes d’Ubisoft s’en sont bien tirées même si l’aspect graphique n’est pas aussi abouti que celui de Crysis. Le jeu est aussi moins gourmand ce qui n’est pas plus mal. Il supporte DirectX 10.1 pour améliorer les performances des cartes compatibles. Nous avons installé le patch 1.02 et utilisé le mode de qualité graphique « ultra élevé ».

Les GeForce apprécient particulièrement Far Cry 2 !

Page 16 - H.A.W.X.

H.A.W.X.

H.A.W.X. est un jeu d’action qui se passe dans les airs. Il utilise un moteur qui prend en charge DirectX 10.1 pour optimiser le rendu. Parmi les effets graphiques supportés, notons la présence de l’occlusion ambiante qui est poussée à son maximum tout comme les autres options. Nous utilisons le benchmark intégré et le patch 1.2 est installé.

Les Radeon HD 6900 n’apportent ici qu’un très petit gain.

Page 17 - BattleForge

BattleForge

Premier jeu à supporter DirectX 11, ou plus précisément Direct3D 11, il nous était difficile de ne pas l’intégrer à ce test. Une mise à jour déployée en septembre 2009 a en effet ajouté le support de la nouvelle API de Microsoft à BattleForge.

Ce sont les Compute Shaders 5.0 qui sont ici exploités par les développeurs pour accélérer le traitement du SSAO, soit de l’occlusion ambiante. Par rapport à l’implémentation classique, via les Pixel Shaders, la technique permet d’exploiter plus efficacement la puissance de calcul disponible en saturant moins les unités de texturing. BattleForge propose deux niveaux de SSAO : High et Very High. Seul le second, appelé HDAO (High Definition AO), exploite les Compute Shader 5.0.

Nous avons utilisé le benchmark intégré au jeu et installé la dernière mise à jour disponible à ce jour (1.2 build 298942).

Avec antialiasing, la Radeon HD 6970 est ici devancé très légèrement par la Radeon HD 5870.

Les GeForce dominent très nettement.

Page 18 - Civilization V

Civilization V

Plutôt réussi visuellement, Civilization V exploite DirectX 11 d’une part pour améliorer la qualité et optimiser les performances du rendu des terrains grâce à la tessellation et d’autre part implémente une compression spéciale des textures grâce aux compute shader, compression qui permet de garder en mémoire les scènes de tous les leaders. Cette seconde utilisation de DirectX 11 ne nous concerne cependant pas ici puisque nous utilisons le benchmark intégré sur une carte de jeu. Nous zoomons légèrement de manière à réduire la limitation CPU qui est très forte dans ce jeu.

Tous les détails sont poussés à leur maximum et nous mesurons les performances avec ombres et réflexions. Le patch 1.2 est installé.

Les Radeon HD 6900 affichent ici un gain conséquent mais restent derrière les GeForce GTX 500.

Etrangement la Radeon HD 5870 2 Go semble avoir du mal à profiter du multi-GPU dans ce jeu avec les derniers pilotes.

Page 19 - S.T.A.L.K.E.R. Call of Pripyat

S.T.A.L.K.E.R. Call of Pripyat

Cette nouvelle suite de S.T.A.L.K.E.R. repose sur une évolution du moteur, en version 1.6.02, et supporte Direct3D 11 qui est exploité d’une part pour améliorer les performances et d’autres part la qualité avec en option des ombres et des éclairages plus détaillés ainsi qu’un support de la tessellation.

Le mode de qualité utilisé est « maximum » et nous avons activé la tessellation. Le jeu ne supporte pas l’antialiasing 8x. Notre scène de test représente 50% en extérieur et 50% en intérieur et dans ce dernier cas nous sommes face à plusieurs personnages.

Les Radeon HD 6900 gagnent légèrement en efficacité avec antialiasing dans ce jeu.

CrossFire X apporte ici plus de gain que le SLI ce qui donne un petit avantage aux Radeon HD 6900 sur les GeForce GTX 500.

Page 20 - F1 2010

F1 2010

Dernier né chez Codemaster, F1 2010 reprend le même moteur que DiRT 2 et supporte ainsi DirectX 11, via le patch 1.1 que nous avons bien entendu installé. Ce patch ayant été développé en collaboration avec AMD, Nvidia nous a indiqué ne l’avoir reçu que tardivement et ne pas encore avoir eu l’opportunité d’optimiser ses pilotes pour ce jeu en version DirectX 11.

Pour mesurer les performances, nous poussons toutes les options graphiques à leur maximum et utilisons l’outil de test intégré sur le circuit de Spa-Francorchamps avec une seule F1.

Dans F1 2010, les Radeon sont particulièrement à l’aise et la GeForce GTX 580 est devancée par la Radeon HD 6970.

En multi-GPU, les Radeon dominent largement.

Page 21 - Metro 2033

Metro 2033

Probablement le jeu le plus lourd du moment, Metro 2033 met à genoux toutes les cartes graphiques récentes. Il supporte GPU PhysX, mais uniquement pour générer des particules lors des impacts, un effet plutôt discret que nous n’avons donc pas activé pour les tests. En mode DirectX 11, il affiche des performances identiques au mode DirectX 10 mais propose 2 options supplémentaires : la tessellation pour les personnages et un effet de champ (Depth of Field) très évolué et très gourmand.

Nous l’avons testé en mode DirectX 11, avec une qualité très élevée et la tessellation activée avec et sans MSAA 4x. Nous avons ensuite mesuré les performances avec MSAA 4x et le Depth of Field.

Les Radeon HD 6900 affichent ici un gain conséquent sur les Radeon HD 5800, ce qui permet à la Radeon HD 6970 d’égaler la GeForce GTX 570.

Les Radeon souffrent un petit peu moins que les GeForce en 2560x1600.

Page 22 - Récapitulatif des performances

Récapitulatif

Bien que les résultats de chaque jeu aient tous un intérêt, d’autant plus avec les solutions haut de gamme dont les scores sont susceptibles d’être lissés par la limitation CPU de certains jeux, nous avons calculé un indice de performances en nous basant sur l'ensemble de résultats et en attachant une importance particulière à donner le même poids à chacun des jeux. Mafia II est ici intégré avec les scores obtenus sans les effets GPU PhysX.

Nous avons attribué un indice de 100 à la Radeon HD 5870 2 Go en 1920x1200 avec AA4x :

Maintenez la souris sur le graphe pour classer les cartes par performances en 1920 AA4x.
La Radeon HD 6970 termine au final légèrement derrière la GeForce GTX 570, excepté avec AA8x où elle l’égale. La Radeon HD 6950 égale pour sa part la Radeon HD 5870. Vous noterez au passage qu’en 1920x1200, les 2 Go de mémoire n’ont qu’une utilité limitée dans les jeux actuels.

Au final, Cayman n’affiche qu’un gain limité de 7 à 14% sur Cypress qu’il remplace. Par rapport à Barts, GPU milieu de gamme, la différence varie entre 17 et 26%, ce qui est plus faible que d’habitude entre 2 GPUs. La Radeon HD 6950 n’a donc qu’un avantage de 7 à 14% sur la Radeon HD 6870.

Nous noterons également un écart plus faible entre les Radeon HD 6970 et 6950 qu’entre les Radeon HD 5870 et 5850.

Maintenez la souris sur le graphe pour classer les cartes par performances en 1920 AA4x.
En bi-GPU, les Radeon HD 6970 et 6950 profitent de quelques jeux limités par le CPU et de gains plus importants dans certains autres pour mieux se positionner. Les Radeon HD 6970 en CrossFire X affichent ainsi une prestation proche de celle des GeForce GTX 580 en SLI et les Radeon HD 6950 en CrossFire X se rapprochent des GeForce GTX 570 en SLI.

Vous remarquerez également que les gains apportés par le multi-GPU sont plus importants sur les Radeon HD 6950 que sur les Radeon HD 5870 alors que leur niveau de performances en mono-GPU est similaire. AMD indique avoir amélioré quelque peu le support du CrossFire X, sans donner plus de détails, mais nous avons également remarqué que les gains sur certains jeux étaient moins élevés avec les Radeon HD 5800 et 6800 que lors d’un précédent test qui utilisait des pilotes différents.

Page 23 - Conclusion

Conclusion

A l’heure de conclure, il est difficile de se défaire d’un avis mitigé sur le nouveau GPU qui équipe les Radeon HD 6900 tant leurs prestations varient fortement d’un jeu à l’autre. Dans le meilleur des cas nous avons observé un gain de 35% sur la Radeon HD 5870 alors que dans le pire des cas c’est à une perte de 6% que nous avons eu affaire.

Certes, les changements architecturaux sont suffisamment importants pour supposer qu’AMD dispose d’une marge de progression, notamment en travaillant son compilateur. Nous restons cependant sceptiques par rapport à la nouvelle organisation des unités de calcul, d’autant plus qu’elle revient à réduire la puissance de calcul par rapport aux unités de texturing, contrairement à la tendance installée depuis plusieurs années chez AMD. Nous sommes d’autant plus sceptiques que les Radeon HD 6900 semblent incapables de profiter pleinement de toutes ces unités de texturing puisque cela les amène dans la limite de consommation qu’elles ne peuvent dépasser.

Paradoxalement il s’agit là d’une des avancées majeures apportée par AMD : une unité capable de contrôler la consommation du GPU et de l’empêcher d’aller au-delà en jouant avec les fréquences, tout comme le font les CPUs depuis quelques temps déjà. Enfin, la consommation ne peut plus s’emballer d’une manière déraisonnable. Si l’incidence détaillée de cette technologie reste à observer plus en détail, à terme elle ne peut qu’être bénéfique en ouvrant la voie à un mode Turbo pour les GPUs et en permettant au monde mobile de disposer de solutions graphiques à l’enveloppe thermique taillée sur mesure.

Au final, c’est une fois de plus via la tarification qu’AMD a décidé de nous convaincre. Proposée à 330€, la Radeon HD 6970 est ainsi légèrement moins chère que la GeForce GTX 570 tout en offrant une prestation similaire. Chaque solution dispose de ses avantages : Eyefinity et 2 Go pour la Radeon contre PhysX et un écosystème 3D stéréo plus développé pour la GeForce. De notre côté, si la Radeon HD 6970 est bel et bien une alternative solide, nous conservons une petite préférence pour la GeForce GTX 570 aux nuisances sonores mieux maîtrisées.

Avec un niveau de performances identique en moyenne, 2 Go par défaut pour assurer l’avenir, et une tarification agressive de 270€ la Radeon HD 6950 remplace avantageusement la Radeon HD 5870. Si elle profite de l’absence totale de concurrence directe de la part de Nvidia (en attendant une GeForce GTX 560 ?), nous ne pouvons cependant nous empêcher de penser qu’une version 1 Go, et donc un petit peu moins chère, aurait été encore une meilleure affaire, effaçant alors presque complètement l’intérêt de la Radeon HD 6870.

Ces nouvelles Radeon profitent par ailleurs d’un très bon comportement en CrossFire X et avec 2 Go de mémoire par défaut elles représenteront probablement de très bonnes candidates à l’upgrade multi-GPU une fois le moment venu. Dans l’immédiat un tel système permettra de profiter du surround gaming très gourmand en puissance et en mémoire. Attention cependant aux nuisances sonores qui sont très importantes avec ces systèmes multi-GPU haut de gamme.

Notez pour terminer qu’AMD conserve un carton rouge pour avoir eu la très mauvaise idée, avec l’arrivée de ses Radeon HD 6800, de réduire par défaut, et pour l’ensemble de ses modèles haut de gamme, la qualité graphique à travers des optimisations trop agressives du filtrage des textures. En 2010, ce n’est plus acceptable !