HardWare.fr


AMD Radeon HD 7790 et GeForce GTX 650 Ti Boost en test
Cartes Graphiques
Publié le Lundi 8 Avril 2013 par Damien Triolet

URL: /articles/890-1/amd-radeon-hd-7790-test-nvidia-geforce-gtx-650-ti-boost.html


Page 1 - Introduction

La famille Radeon HD 7000 s'agrandit avec l'arrivée de Bonaire, le cinquième GPU dérivé de l'architecture GCN. Celui-ci prend place dans une nouvelle carte graphique milieu de gamme, la Radeon HD 7790, qui pour moins de 150€ promet de donner du fil à retordre à la concurrence. En réaction, Nvidia propose la GeForce GTX 650 Ti Boost, qui contrairement à ce que son nom laisse penser et plus proche d'une GeForce GTX 660 que d'une GeForce GTX 650 Ti classique.



Les Radeon HD 7000 jusque fin 2013
La stratégie d'AMD pour 2013 a souffert d'un peu de confusion, principalement parce que nous supposions l'arrivée pour ce début d'année des Radeon HD 8000 et d'une nouvelle gamme de cartes graphiques. Il n'en est rien et les Radeon HD 7000 vont occuper le terrain jusqu'à la fin de l'année. Cependant, par opportunisme commercial, AMD a renommé l'ensemble des Radeon HD 7000 en Radeon HD 8000 OEM. Une Radeon HD 8870 OEM par exemple est identique à une Radeon HD 7870.

Là où ça se complique, c'est que des nouveautés sont prévues à l'intérieur de la gamme Radeon HD 7000 et de son renommage OEM. Nous l'avions déjà vu avec l'introduction du GPU Oland (non illustré ci-dessous) qui venait compléter en entrée de gamme et dans le monde mobile les GPU Cape Verde (HD 7750, 7770), Pitcairn (HD 7850, 7870) et Tahiti (HD 7950, 7970).


Si, en jouant avec les mots (voir en les mélangeant lors d'une présentation), AMD nous avait donné l'impression qu'il n'y aurait plus de nouvelle puce développée avant la fin de l'année, il s'avère que ce n'est pas correct. La Radeon HD 7790 lancée aujourd'hui introduit ainsi un cinquième GPU GCN : Bonaire. Ce GPU se situe entre Cape Verde et Pitcairn et est probablement voué à terme à remplacer le premier dont nous pouvons imaginer qu'AMD va mettre fin à la production. Bonaire et Oland sont en effet suffisants pour couvrir l'ensemble de l'entrée de gamme et une partie du milieu de gamme.

Avec la Radeon HD 7790, c'est à la GeForce GTX 650 Ti qu'AMD s'attaque frontalement en promettant des performances supérieures pour un tarif identique de 140€. Certes, pour quelques euros de plus la Radeon HD 7850 1 Go contrait déjà plus ou moins bien la carte de Nvidia, mais cette variante de la Radeon milieu de gamme devrait disparaître selon AMD qui explique que pour placer 1 Go sur son bus de 256-bit il faut avoir recours à des modules GDDR5 de faible densité dont la production serait maintenant terminée.


La réaction de Nvidia
Nvidia ne compte pas se laisser faire, d'une part avec une réduction du tarif de la GeForce GTX 650 Ti, qui chute à 125 € et d'autre part en précipitant la sortie d'une nouvelle variante de la GeForce GTX 650 Ti qui passe en version Boost. Celle-ci est en réalité très proche de la GeForce GTX 660, ne s'en différenciant que par le nombre d'unités de calcul réduit de 20%. Prévue à un tarif de 165-170€ en version 2 Go, et de 150€ en version 1 Go, elle est destinée à permettre à Nvidia de s'attaquer autant à la Radeon HD 7790 qu'à la Radeon HD 7850.

Etonnamment, la GeForce GTX 650 Ti Boost 1 Go a besoin des mêmes modules mémoire de faible densité que la Radeon HD 7850 1 Go mais Nvidia nous indique ne pas rencontrer de problème de disponibilité à leur niveau.


Mise à jour du 8 avril 2013 :
Nous avons intégré le test de la GeForce GTX 650 Ti Boost à ce dossier, ajouté BioShock Infinite et mis à jour les résultats sous Crysis 3, Far Cry 3 et Tomb Raider avec les derniers pilotes et patchs.


Page 2 - Bonaire et GCN 1.1 pour la HSA ?

Bonaire et GCN 1.1 pour la HSA ?

Bonaire est basé sur l'architecture GCN, comme les autres GPU de la gamme Radeon HD 7000. Vous pourrez en retrouver le détail ici. Rappelons grossièrement que cette architecture repose sur des blocs fondamentaux appelés Compute Units (CU) qui intègrent chacun 64 unités de calcul (les "cores" en langage marketing), 4 unités de texturing, des caches et toute la logique de contrôle nécessaire au bon fonctionnement de l'ensemble. Voici résumées les spécifications des 5 GPU GCN actuels :

Oland : 6 CU, 1 triangle par cycle, 16 ROP, 128 bits
Cape Verde : 10 CU, 1 triangle par cycle, 16 ROP, 128 bits
Bonaire : 14 CU, 2 triangles par cycle, 16 ROP, 128 bits
Pitcairn : 20 CU, 2 triangles par cycle, 32 ROP, 256 bits
Tahiti : 32 CU, 2 triangles par cycle, 32 ROP, 384 bits

Comme les autres GPU de la famille GCN, Bonaire est fabriqué en 28 nanomètres chez TSMC. AMD ne précise pas la variante du process, mais nous supposons que tous ces GPU exploitent le 28 nm HPL, à l'exception de Tahiti qui exploiterait le 28 nm HP, raison pour laquelle les résultats de ce GPU sont plus variables en terme de consommation ainsi que de tension / fréquence lors d'overclockings.


Alors que Cape Verde se contente de 1.5 milliards de transistors et d'une surface de 123 mm², Bonaire passe à 2.1 milliards de transistors et 158 mm², ce qui reste plus petit que les 2.8 milliards de transistors et 212 mm² de Pitcairn mais aussi que les 2.5 milliards de transistors et 214 mm² du GK106.



L'architecture GCN évolue légèrement
Bien qu'AMD ne mette en avant ce point, ou tout du moins évite d'en parler, Bonaire introduit une légère évolution de l'architecture GCN qui pourrait être qualifiée de 1.1 (ce que ne fait pas AMD pour le moment). Ces évolutions concernent principalement le processeur de commande du GPU et sont destinées au GPU compute et à la HSA (Heterogeneous System Architecture).

Parmi les évolutions, notons le support de 8 files d'attente par compute pipeline, ce qui va dans le sens de la technologie Hyper Q de Nvidia réservée aux Tesla K20 et permet de mieux alimenter le GPU en évitant que lors de dépendances entre kernels (programmes à exécuter), le GPU ne se retrouver bloqué en attendant le résultat de l'un d'eux. Nous supposons ici que par compute pipeline AMD entend ACE (Asynchronous Compute Engine) et que les 2 ACE de Bonaire permettent de supporter 16 files d'attente.

Un adressage mémoire unifié est également au programme et de nouvelles instructions font leur apparition dont certaines dédiées au débogage du code.

Voici un extrait du document qui détaille l'évolution du jeu d'instruction mais qui a été retiré par AMD le temps d'en corriger certaines notations qui étaient peu claires au niveau du nom des différentes architectures :

Important differences between xx and yy GPUs

Multi queue compute
Lets multiple user-level queues of compute workloads be bound to the device and processed simultaneous. Hardware supports up to eight compute pipelines with up to eight queues bound to each pipeline.

System unified addressing
Allows GPU access to process coherent address space.

Device unified addressing
Lets a kernel view LDS and video memory as a single addressable memory. It also adds shader instructions, which provide access to “flat” memory space.

Memory address watch
Lets a shader determine if a region of memory has been accessed.

Conditional debug
Adds the ability to execute or skip a section of code based on state bits under control of debugger software. This feature adds two bits of state to each wavefront; these bits are initialized by the state register values set by the debugger, and they can be used in conditional branch instructions to skip or execute debug-only code in the kernel.

Support for unaligned memory accesses

Detection and reporting of violations in memory accesses

New instruction formats:
FLAT

New instructions:
FLAT_* (entire family of operations)
S_CBRANCH_CDBGUSER
S_CBRANCH_CDBGSYS
S_CBRANCH_CDBGSYS_OR_USER
S_CBRANCH_CDBGSYS_AND_USER
S_DCACHE_INV_VOL
V_TRUNC_F64
V_CEIL_F64
V_FLOOR_F64
V_RNDNE_F64
V_QSAD_PK_U16_U8
V_MQSAD_U16_U8
V_MQSAD_U32_U8
V_MAD_U64_U32
V_MAD_I64_I32
V_EXP_LEGACY_F32
V_LOG_LEGACY_F32
DS_NOP
DS_GWS_SEMA_RELEASE_ALL
DS_WRAP_RTN_B32
DS_CNDXCHG32_RTN_B64
DS_WRITE_B96
DS_WRITE_B128
DS_CONDXCHG32_RTN_B128
DS_READ_B96
DS_READ_B128
BUFFER_LOAD_DWORDX3
BUFFER_STORE_DWORDX3

Removed instructions:
V_QSAD_U8
V_MQSAD_U8
BUFFER_ATOMIC_RSUB, _X2
IMAGE_ATOMIC_RSUB, _X2


Page 3 - Spécifications, PowerTune, GTX 650 Ti Boost

Spécifications

La Radeon HD 7790 affiche une puissance de calcul similaire à celle de la Radeon HD 7850, un débit géométrique plus élevé, mais par contre une bande passante mémoire et un fillrate nettement plus faibles. Ce dernier point n'évolue d'ailleurs pas par rapport à la Radeon HD 7770 alors que la bande passante mémoire progresse cependant de 33% grâce à une fréquence en hausse, AMD ayant adapté ses contrôleurs mémoire à cet effet. Rappelons que seules les Radeon HD 7000 supportent DirectX au niveau 11_1, là où les GeForce 600 se contentent du niveau 11_0.

La GeForce GTX 650 Ti Boost est basée sur le GPU GK106, comme les GeForce GTX 650 Ti et GTX 660. Elle est très proche de la dernière avec des fréquences et une configuration mémoire identique. Elle ne s'en démarque que par la désactivation d'un des 5 SMX (bloc de 192 unités de calcul) du GK106, ce qui impacte sa puissance de calcul de 20%.

Notez que Nvidia supporte depuis quelques temps les configurations mémoire de type asymétriques. C'est le cas pour la GeForce GTX 650 Ti Boost qui intègre 1 ou 2 Go de mémoire sur un bus 192-bit, qui est en général associé à 768 Mo, 1.5 Go ou 3 Go. L'approche de Nvidia revient à placer 256/512 Mo sur chacun des 2 premiers contrôleurs mémoire de 64-bit et 512/1024 Mo sur le troisième. En d'autres termes, sur une GeForce GTX 650 Ti Boost, 768 Mo ou 1.5 Go sont accessibles à pleine vitesse, via un bus 192-bit, alors que les 256/512 Mo restant doivent se contenter d'un accès plus lent, via un bus 64-bit. Il revient au pilote d'organiser les données de manière à limiter voire masquer totalement l'impact de cet accès plus lent à une partie de la mémoire. En pratique Nvidia s'en tire très bien et l'impact est négligeable sur les variantes 2 Go des GeForce GTX 600. C'est également le cas des variantes 1 Go des petites GeForce GTX 500. Il restera cependant à vérifier si cela reste vrai pour la GTX 650 Ti Boost dans les jeux actuels.


GeForce GTX 650 Ti Boost de référence
Si AMD n'a pas prévu de Radeon HD 7790 de référence, tout du moins elle n'a pas été distribuée à la presse, Nvidia nous a fourni une GeForce GTX 650 Ti Boost de référence :


Celle-ci est en tout point identique à la GeForce GTX 660 de référence, dont vous pourrez retrouver les détails du design ici.

La GeForce GTX 650 Ti Boost partage le même TDP que la GeForce GTX 660 : 140W. La limite de consommation pour que le turbo maison, GPU Boost, puisse s'enclencher est, elle aussi, identique : 115W. Nvidia autorise, pour l'overclocking, une augmentation de 10% de celle-ci qui passe alors à 127W.

Bien que la fréquence officielle de GPU Boost soit de 1032 MHz, elle est en réalité variable et notre exemplaire pouvait monter jusqu'à 1084 MHz. En pratique, grâce à une consommation relative légèrement inférieure, la GeForce GTX 650 Ti Boost est plus à même de profiter de cette marge supplémentaire que la GeForce GTX 660.


Bonaire et PowerTune
PowerTune est la technologie de contrôle de la consommation des GPU AMD. Elle consiste à utiliser de nombreux capteurs de charge internes pour estimer aussi précisément que possible la consommation du GPU de manière à l'empêcher de dépasser le TDP, qui est de 85W sur Bonaire. Une approche qui est totalement déterministe et permet à chaque exemplaire d'afficher des performances identiques dans des conditions identiques, comme c'est le cas sur les CPU et contrairement à la technologie GPU Boost de Nvidia qui se base sur une mesure de l'intensité du courant.


Sur les Radeon HD 7000 originales, 3 P-states étaient exploitées par PowerTune avec un High State dans lequel pouvait évoluer les fréquences/tensions. Les Radeon HD 7970 GHz Edition et HD 7950 v2 ont introduit un 4ème P-state. Ce Boost State permet d'ajouter de faire évoluer fréquence et tension à un niveau plus élevé.

Le Boost State a probablement été exploité sur Tahiti parce que la production de celui-ci est très variable et que valider des fréquences élevées est plus complexe. Ce n'est pas le cas sur Cape Verde et sur Pitcairn et de toute évidence sur Bonaire. Pour ce dernier, AMD a simplifié le fonctionnement de PowerTune :


8 P-States qui représentent des couples fréquence/tension différents sont cette fois exploités. Suivant l'activité du GPU, l'estimation de sa consommation et de son échauffement, PowerTune va faire passer le GPU d'un P-Sate à l'autre avec une granularité de 10 ms. AMD précise cependant que dans les outils d'overclocking, la fréquence reportée sera lissée, sans donner plus de précisions à ce sujet.


Page 4 - Performances théoriques : pixels

Notez que pour toutes les performances théoriques, les GeForce GTX tournaient à leur fréquence GPU maximale respective, à savoir 1110 MHz pour la GTX 680, 1097 MHz pour la GTX 660 et 1006 MHz pour la GTX Titan.

Performances texturing
Nous avons mesuré les performances lors de l'accès à des textures de différents formats en filtrage bilinéaire : en 32 bits classique (8x INT8), en 64 bits "HDR" (4x FP16), en 128 bits (4x FP32), en profondeur de 32 bits (D32F) et en FP10, un format HDR introduit par DirectX 10 qui permet de stocker des textures HDR en 32 bits avec quelques compromis.


Les GeForce GTX sont capables de filtrer les textures FP16 à pleine vitesse contrairement aux Radeon qui compensaient jusqu'ici par une puissance de filtrage tellement supérieure, que même si elles devaient filtrer les textures FP16 à demi-vitesse, elles affichaient des débits proches des GeForce. Ce n'est plus le cas avec les GeForce GTX 600 qui prennent une avance considérable sur ce point. La GeForce GTX Titan ne fait qu'enfoncer le clou et devance la Radeon HD 7970 GHz de près de 50% sur ce point.

Notez cependant que dans ce test, les GeForce GTX 600 ont du mal à atteindre leur débit maximal alors que leur fréquence GPU est pourtant maximale. Les Radeon HD 7700 basées sur Cape Verde ont également du mal à atteindre leur maximum théorique, cette fois parce que PowerTune les en empêche en réduisant la fréquence GPU, estimant que le niveau de consommation est trop élevé lorsque leurs unités de texturing sont saturées. Ce n'est pas le cas pour les Radeon HD 7900 ni pour les Radeon HD 7800 (depuis la mise à jour de PowerTune en automne 2012), ni pour la Radeon HD 7790.


Fillrate
Nous avons mesuré le fillrate sans et puis avec blending, et ce avec différents formats de données :


[ Standard ]  [ Avec blending ]

Le fillrate peut être vu comme le point faible du GK110. Ainsi, il n'augmente que très peu par rapport au GK104, un peu plus de 10% en théorie et un petit peu moins en pratique. Pourtant, les 14 SMX de la GeForce GTX Titan sont capables de transférer 56 pixels par cycle vers les ROP et ceux-ci sont capables d'en écrire 48 en mémoire par cycle, contre 32 et 32 pour une GeForce GTX 680. La limitation se situe en fait au niveau des rasterizers : le GK110 en dispose de 5 contre 4 pour le GK104. Chacun de ceux-ci étant capable de générer 8 pixels, le GK110 est en réalité limité à 40 pixels par cycle contre 32 pour le GK104. La différence de fréquence réduit encore cet écart.

Le fillrate de Bonaire n'évolue pas lui non plus par rapport à celui de Cape Verde. Tout comme pour les Radeon HD 7900 par rapport aux Radeon HD 7800, la bande passante mémoire supérieure de la Radeon HD 7790 par rapport à la Radeon HD 7770 lui permet de maximiser le fillrate dans certains cas, par exemple avec blending.

Au niveau du fillrate, les GeForce GTX Kepler sont enfin capables de transférer les formats FP10/11 et RGB9E5 à pleine vitesse vers les ROP, bien que le blending de ces formats se fasse toujours à demi vitesse. Si les GeForce et les Radeon sont capables de traiter le FP32 simple canal à pleine vitesse sans blending, seules ces dernières conservent ce débit avec blending. Elles sont par ailleurs nettement plus rapides en FP32 quadruple canal (HDR 128 bits). Les GeForce semblent cependant faire un meilleur usage de leur bande passante mémoire disponible dans le cas du FP16 avec blending.


Page 5 - Performances théoriques : géométrie

Notez que pour toutes les performances théoriques, les GeForce GTX tournaient à leur fréquence GPU maximale respective, à savoir 1110 MHz pour la GTX 680, 1097 MHz pour la GTX 660 et 1006 MHz pour la GTX Titan.

Débit de triangles
Etant donné les différences architecturales des GPUs récents au niveau du traitement de la géométrie, nous nous sommes évidemment penchés de plus près sur le sujet. Tout d'abord nous avons observé les débits de triangles dans deux cas de figure : quand tous les triangles sont affichés et quand ils sont tous rejetés (parce qu'ils tournent le dos à la caméra) :


Les GeForce GTX 600 ne font pas mieux que les Radeon HD 7900/7800 lorsque les triangles doivent être rendus, peut-être parce qu'elles sont engorgées à un endroit ou à un autre, ou encore parce que leurs performances ont été réduites artificiellement pour différencier les Quadro des GeForce. La GeForce GTX Titan est par contre légèrement devant la Radeon HD 7970 GHz Edition.

Quand les triangles peuvent être éjectés du rendu, les GeForce GTX Titan, 680 et 660 profitent pleinement de leur capacité de prise en charge de 7, 4 ou 2.5 triangles par cycle pour prendre le large. Bonaire se comporte ici exactement comme Tahiti et Pitcairn.

Ensuite nous avons effectué un test similaire mais en utilisant la tessellation :


Avec les GeForce GTX Kepler, Nvidia réaffirme sa supériorité lorsqu'il s'agit de traiter un nombre important de petits triangles générés par un niveau de tessellation élevé, les Radeon HD 7900 ne se démarquant pas des Radeon HD 7800 et de la Radeon HD 7790 qui disposent du même nombre d'unités fixes dédiées à cette tâche.

L'architecture des Radeon fait qu'elles peuvent être engorgées par la quantité de données générées, ce qui réduit drastiquement leur débit dans ce cas. Le doublement de la taille du buffer dédié à l'unité de tessellation dans le GPU des Radeon HD 6800 leur a permis d'être significativement plus performantes que les Radeon HD 5000. AMD a continué dans cette voie avec les Radeon HD 7000.


Page 6 - Sapphire Radeon HD 7790 Dual-X OC

Sapphire Radeon HD 7790 Dual-X OC
Pour ce test, Sapphire nous a fourni un exemplaire de son modèle Dual-X OC :




Au format relativement compact, la carte embarque un système de refroidissement Dual-X double slot équipé de 2 ventilateurs de 80mm. Plutôt efficace et discret, au repos comme en charge, ce ventirad est composé d'une base en cuivre de laquelle partent 2 caloducs de 8mm de diamètre qui vont rejoindre le radiateur en aluminium.

Sapphire a revu la connectique de référence d'AMD pour pouvoir proposer 2 sorties DVI. La sortie HDMI est toujours présente mais les 2 mini-DP sont par contre remplacés par un seul DisplayPort, un compromis qui sera probablement plus pratique pour la plupart des utilisateurs.

Le PCB est plutôt peu complexe avec une large partie vide à l'arrière qui n'est présente que pour faire office de support au ventirad. L'étage d'alimentation est composé de 4 phases dédiées au GPU et d'une phase dédiée à la mémoire, dont les composants sensibles sont protégés par un petit dissipateur.

Sapphire annonce ce modèle à 145 € en France soit seulement 5 € de plus que le prix de lancements des modèles basiques.


Page 7 - Consommation, efficacité énergétique

Consommation
Nous avons utilisé le protocole de test qui nous permet de mesurer la consommation de la carte graphique seule. Nous avons effectué ces mesures au repos sur le bureau Windows 7 ainsi qu'en veille écran de manière à observer l'intérêt de ZeroCore Power d'AMD. Pour la charge, nous avons opté pour des mesures dans Anno 2070, en 1080p avec tous les détails poussés à leur maximum, ainsi que dans Battlefield 3, en 1080p dans le mode High.

Notez que pour ce test, nous avons refait les mesures de consommation sur l'ensemble des cartes, avec les pilotes et jeux à jour. Nous avons également réduit la fréquence de la carte de Sapphire pour observer la consommation de la Radeon HD 7790 aux fréquences de référence.


Au repos, la Radeon HD 7790 affiche une consommation similaire à celle des autres Radeon HD 7700. Un peu plus élevée que pour les GeForce GTX 660 et 650 Ti sur le bureau Windows mais nettement inférieure en veille écran.

En charge, le modèle Dual-X OC de Sapphire est légèrement plus gourmand que la Radeon HD 7770 de référence, mais sa consommation revient au même niveau une fois les fréquences fixées au niveau de la Radeon HD 7790 de référence. Elles sont alors du même ordre que celles de la GeForce GTX 650 Ti dans Battlefield 3. La GeForce GTX 650 Ti Boost, pour sa part, affiche une consommation similaire à celle de la GeForce GTX 660, leur cible de consommation GPU Boost étant identique (115W), mais le fait en conservant des fréquences plus élevées.

Nous avons mis en relation ces mesures de consommation avec les performances, en retenant des fps par 100W pour que les données soient plus lisibles :


[ Anno 2070 1080p Max ]  [ Battlefield 3 1080p High ]

Avec la Radeon HD 7790, Bonaire s'avère être le GPU actuel à l'efficacité énergétique la plus élevée. L'évolution est significative par rapport à la Radeon HD 7770. A l'inverse, l'efficacité énergétique de la GeForce GTX 650 Ti Boost est quelque peu en retrait.

Notons que chaque jeu représente un cas particulier et que le rendement varie d'un exemplaire de chaque carte à l'autre, parce que leur niveau de consommation réel varie et d'autre part dans le cas des GeForce parce que leur fréquence maximale et donc leurs performances varient.


Page 8 - Protocole de test

Protocole de test
Pour ce test, nous avons légèrement revu notre protocole, en remplaçant Crysis 2 par Crysis 3 et en intégrant Tomb Raider et Bioshock Infinite. Tous ces jeux sont testés avec leur dernier patch au 08/04/2013, la plupart étant maintenus à jour via Steam/Origin/Uplay, ce qui implique une mise à jour des résultats pour Crysis 3, Far Cry 3 et Tomb Raider par rapport à la version originale de ce dossier. Les différences des performances au niveau de ces jeux ce sont cependant avérées insignifiantes.

Nous avons opté pour un niveau de qualité qui correspond à ce qui nous semblé être le meilleur compromis qualité / fluidité pour le niveau de performances de la Radeon HD 7790. Nous avons décidé de ne plus utiliser le niveau de MSAA (4x et 8x), comme critère principal pour segmenter nos résultats. De nombreux jeux au rendu différé proposent d'autres formes d'antialiasing, la plus courante étant le FXAA développé par Nvidia. Cela n'a donc plus de sens d'organiser un indice autour d'un certain niveau d'antialiasing, ce qui nous permettait par le passé de nous focaliser sur l'efficacité du MSAA.

Nous n'affichons plus les décimales dans les résultats de performances dans les jeux pour rendre les graphiques plus lisibles. Ces décimales sont néanmoins bien notées et prises en compte pour le calcul de l'indice. Si vous êtes observateurs vous remarquerez que c'est également le cas pour la taille des barres dans les graphes.

Toutes les Radeon ont été testées avec les pilotes Catalyst 13.3 beta (12.101.2.1) et toutes les GeForce ont été testées avec les pilotes beta 314.14 à l'exception de Crysis 3, Far Cry 3, Tomb Raider et Bioshock Infinite qui ont été testés avec les pilotes 314.22 WHQL. Nous avons forcé l'activation du PCI Express 3.0 sur la plateforme X79.

Nous avons fait en sorte de tester la GeForce GTX 660 et la GeForce GTX 650 Ti Boost à leurs spécifications minimales garanties au niveau de GPU Boost. Nous avons pour cela joué avec les paramètres d'overclocking de manière à ce que la fréquence en pratique corresponde bien à celle d'une carte dont la fréquence turbo maximale serait la fréquence GPU Boost officielle. Insistons bien sur le fait que cela ne revient pas à désactiver GPU Boost ! Dans le cas de la GeForce GTX 660, fortement limitée par sa consommation, l'impact est insignifiant (< 1%), alors qu'il est compris entre 1 et 3% suivant les jeux pour la GeForce GTX 650 Ti Boost par rapport au potentiel maximal de notre échantillon de test.

Configuration de test
Intel Core i7 3960X (HT off, Turbo 1/2/3/4/6 cores: 4 GHz)
Asus P9X79 WS
8 Go DDR3 2133 Corsair
Windows 7 64 bits
Pilotes GeForce beta 314.14 / WHQL 314.22
Catalyst 13.3 beta


Page 9 - Benchmark : Alan Wake

Alan Wake

Alan Wake est un portage console plutôt bien exécuté et basé sur DirectX 9. Il a la particularité d'imposer l'utilisation du MSAA, nécessaire pour le rendu correct des herbes.

Nous utilisons le niveau de qualité Medium proposés par le jeu qui intègre notamment du MSAA 4x. Nous effectuons un déplacement bien défini et mesurons les performances avec fraps. Le jeu est maintenu à jour via Steam.


Très gourmand en bande passante mémoire, Alan Wake est en général favorable aux Radeon. La GeForce GTX 650 Ti Boost profite pleinement de son bus mémoire de 192-bit pour se détacher de la GeForce GTX 650 Ti et se rapprocher de la GeForce GTX 660.


Page 10 - Benchmark : Anno 2070

Anno 2070

Anno 2070 reprend une évolution du moteur d'Anno 1404 qui intègre un support de DirectX 11.

Nous utilisons le mode de qualité très élevé proposé par le jeu, effectuons un déplacement sur une carte et mesurons les performances avec fraps.


Dans Anno 2070, c'est avant tout la puissance de calcul qui compte et la GeForce GTX 660 devance de 20% la GeForce GTX 650 Ti Boost, qui termine juste derrière la Radeon HD 7790.


Page 11 - Benchmark : Assassin's Creed 3

Assassin's Creed 3

Le dernier opus de la série des Assassin's Creed repose en version PC sur un moteur DirectX 11 qui supporte notamment la tessellation.

Nous poussons toutes les options à leur maximum, si ce n'est pour l'antialiasing que nous testons en mode FXAA HQ. Nous mesurons les performances avec Fraps sur le niveau Boston.


Dans ce jeu, peu dépendant de la bande passante mémoire, les GeForce sont un petit peu plus à l'aise que les Radeon et la GTX 650 Ti Boost devance tout juste la Radeon HD 7850.


Page 12 - Benchmark : Batman Arkham City

Batman Arkham City

Batman Arkham City est mis au point avec une version récente de l'Unreal Engine 3 qui supporte DirectX 11. Bien que ce mode ait souffert d'un gros bug dans la version d'origine du jeu, un patch 1.1 a corrigé cela. Nous utilisons le benchmark intégré.

Les performances sont mesurées en mode Extreme (qui inclus les effets DirectX 11 supplémentaires) avec MSAA 4x. Le jeu est maintenu à jour via Steam.


Batman Arkham City avec MSAA fait partie des quelques jeux principalement limités par la bande passante mémoire. Les GeForce apprécient particulièrement ce titre et la GTX 650 Ti Boost devance la Radeon HD 7850 de plus de 10%.


Page 13 - Benchmark : Battlefield 3

Battlefield 3

Battlefield 3 repose sur le Frosbite 2, un moteur graphique qui fait toujours partie des plus avancés à ce jour. De type rendu différé, il supporte la tessellation et calcule l'éclairage via un compute shader.

Nous testons le mode High et relevons les performances avec Fraps, sur un parcours bien défini. Le jeu est maintenu à jour via Origin.


La GeForce GTX 650 Ti Boost devance assez facilement la Radeon HD 7790 et se rapproche de la Radeon HD 7850.


Page 14 - Benchmark : BioShock Infinite

BioShock Infinite

BioShock Infinite est basé sur un moteur dérivé de l'Unreal Engine 3, qui a notamment été modifié au niveau de l'éclairage. Il supporte le matériel DirectX 10 et DirectX 11 avec certaines améliorations graphiques réservées à l'API plus récente : c'est le cas de plusieurs effets mis en place avec la collaboration d'AMD tels que les Contact Hardening Shadows, le HDAO et le Diffusion Depth of Field. Notez que ces 2 derniers effets font appel aux Compute Shaders.

Nous testons le mode Very High qui ne fait appel ni au DDoF ni à la version HQ du HDAO, et relevons les performances avec Fraps, sur une partie de la scène de bench intégrée au jeu, qui est assez représentative. Le jeu est maintenu à jour via Steam.


Ici aussi, la GeForce GTX 650 Ti Boost devance assez facilement la Radeon HD 7790 et se rapproche de la Radeon HD 7850.


Page 15 - Benchmark : Civilization V

Civilization V

Plutôt réussi visuellement, Civilization V exploite DirectX 11 d'une part pour améliorer la qualité et optimiser les performances du rendu des terrains grâce à la tessellation et d'autre part implémente une compression spéciale des textures grâce aux compute shader, compression qui permet de garder en mémoire les scènes de tous les leaders. Cette seconde utilisation de DirectX 11 ne nous concerne cependant pas ici puisque nous utilisons le benchmark intégré sur une carte de jeu. Nous zoomons légèrement de manière à réduire la limitation CPU qui est très forte dans ce jeu.

Tous les détails sont poussés à leur maximum et nous mesurons les performances avec ombres et réflexions. Le jeu est maintenu à jour via Steam.


Très peu dépendant de la bande passante mémoire, ce jeu met à égalité la Radeon HD 7850 et la GeForce GTX 650 Ti Boost.


Page 16 - Benchmark : Crysis 3

Crysis 3

Crysis 3 reprend le même moteur que Crysis 2 : le CryEngine 3. Ce dernier profite cependant de quelques petites évolutions telles qu'un support plus avancé de l'antialiasing : FXAA, MSAA et TXAA sont au programme, tout comme un nouveau mode appelé SMAA.

Ce dernier est une évolution du MLAA qui permet, optionnellement, de prendre en compte des données de type sous-pixels soit à travers la combinaison avec du MSAA 2x, soit avec une composante temporelle calculée à partir de l'image précédente. Le SMAA 1x est la simple évolution du MLAA, le SMAA 2tx utilise une composante temporelle et le SMAA 4x y ajoute le MSAA 2x. Notez qu'il ne faut pas confondre le SMAA 2tx proposé en mono-GPU avec le SMAA 2x proposé en multi-GPU et qui utilise du MSAA 2x sans composante temporelle. Nous avons opté pour le SMAA 2tx avec le mode de qualité moyen.

Nous mesurons les performances avec Fraps sur la version 1.3 du jeu.


Les GeForce sont relativement plus performantes que les Radeon dans Crysis 3, ce qui permet à la GTX 650 Ti Boost de dépasser la Radeon HD 7850. Notez que le patch 1.3 améliore légèrement les performances sur l'ensemble des cartes.


Page 17 - Benchmark : DiRT Showdown

DiRT Showdown

Dernier né chez Codemaster, DiRT Showdown reprend une évolution légère du moteur DirectX 11 maison. En partenariat avec AMD, les développeurs ont mis en place un éclairage avancé qui prend en compte de nombreuses sources de lumière directes et indirectes ainsi qu'une approximation du rendu de type illumination globale. Ces options supplémentaires ont été activées avec le premier patch du jeu qui a donc été déployé sur notre système, le jeu étant maintenu à jour via Steam.

Pour mesurer les performances, nous poussons toutes les options graphiques à leur maximum, à l'exception de l'éclairage avancé qui est désactivé. Nous utilisons Fraps sur l'outil de test intégré.


Plutôt favorable aux Radeon, DiRT Showdown place la HD 7790 au niveau de la GeForce GTX 650 Ti Boost.


Page 18 - Benchmark : Far Cry 3

Far Cry 3

Far Cry 3 est relativement lourd, notamment à travers les effets d'occultation ambiante, de filtrage des surfaces alpha et bien entendu à travers la MSAA 4x.

Pour mesurer les performances, nous évitons ces deux dernières options, poussons le niveau graphique au niveau élevé et activons le HDAO.

Notez que le SSAO, moins gourmand, propose un rendu immonde, alors que le HBAO produisait des artefacts par endroit avant le patch 1.5 et, même une fois corrigé, affiche un résultat qui se rapproche du SSAO, inférieur au HDAO. Le HBAO ayant été développé à l'origine par Nvidia alors que le HDAO l'a été par AMD, certains testeurs, incités dans ce sens par Nvidia, préfèrent comparer les GeForce avec HBAO aux Radeon avec HDAO. Nous estimons cependant que cette approche n'est pas correcte, le HBAO étant moins gourmand et offrant un résultat inférieur.

Nous utilisons Fraps sur un parcours bien défini.


Les Radeon HD 7000 s'en tirent mieux que les GeForce dans Far Cry 3.


Page 19 - Benchmark : Hitman Absolution

Hitman Absolution

Hitman Absolution utilise un moteur plutôt lourd et qui manque probablement d'optimisations. La charge CPU est par ailleurs relativement élevée dans certaines scènes dans lesquelles une foule importante peut être animée. Différents effets DirectX 11 ont été intégrés avec la coopération d'AMD.

Pour mesurer les performances, nous poussons les options graphiques au niveau high et utilisons l'outil de test intégré au jeu.


Les Radeon s'en tirent mieux que les GeForce et la GTX 650 Ti Boost peine à se démarquer de la Radeon HD 7790.


Page 20 - Benchmark : Max Payne 3

Max Payne 3

Max Payne 3 présente un rendu globalement réussi, bien qu'inégal par endroit, notamment à cause de textures de "qualité console". Il repose sur un moteur DirectX 11 au rendu différé qui supporte plusieurs effets avancés tels que le HDAO ou la tessellation, qui est plutôt lourde une fois poussée au maximum.

Il supporte le FXAA mais également le MSAA, très lourd compte tenu du type de rendu. Ce dernier reste nécessaire pour venir à bout de tout l'aliasing, mais nous devons nous contenter du FXAA pour cette gamme de cartes graphiques.

Nous avons poussé toutes les options à leur maximum et utilisé Fraps sur un parcours bien défini. Le jeu est maintenu à jour via Steam.


La GeForce GTX 650 Ti Boost devance de peu la Radeon HD 7790.


Page 21 - Benchmark : Sleeping Dogs

Sleeping Dogs

Sleeping Dogs nous propose un environnement hongkongais qui peut s'avérer être très gourmand pour nos cartes graphiques dès que les options de son moteur DirectX 11 sont poussées à leur maximum.

Nous utilisons le benchmark intégré au jeu, ce dernier étant maintenu à jour via Steam et donc en version 1.5 pour ce test. Le pack de texture HD a bien entendu été installé. Le niveau de qualité extrême est utilisé, excepté pour l'antialiasing qui reste en mode normal (FXAA). L'aliasing géométrique est très important dans ce jeu, ce qui rend l'utilisation d'un antialiasing avancé préférable, mais ce n'est pas adapté aux cartes testées ici.


La GeForce GTX 650 Ti Boost se place à mi-chemin entre les Radeon HD 7790 et HD 7850.


Page 22 - Benchmark : The Witcher 2 Enhanced Edition

The Witcher 2 Enhanced Edition

The Witcher 2 est un jeu dont le moteur graphique a été peaufiné progressivement, pour en arriver à la récente Enhanced Edition. Bien que basé sur DirectX 9, il est relativement gourmand une fois toutes ses options graphiques poussées au maximum, l'une d'elles étant particulièrement gourmande : l'UberSampling. Il s'agit en réalité d'un antialiasing de type supersampling 4x avec quelques optimisations.

Nous avons testé le jeu en qualité élevée et high, cette dernière désactivant l'Ubersampling. Les performances sont mesurées avec Fraps.


La GeForce GTX 650 Ti Boost a dans ce jeu du mal à se détacher de la Radeon HD 7790.


Page 23 - Benchmark : Tomb Raider

Tomb Raider

Tomb Raider est l'une des meilleures surprises de ce début d'année. Le rendu graphique est plutôt réussi, AMD ayant travaillé avec le développeur pour s'assurer d'une version PC de bon niveau. C'est particulièrement le cas pour TressFX, l'option de rendu avancé des cheveux de Lara qui apporte une bonne dose de réalisme.

Nvidia a sorti des pilotes optimisés pour Tomb Raider, que nous avons utilisés pour la mise à jour de dossier, en combinaison avec le dernier patch du jeu. Notez cependant que le déficit de performances des GeForce s'observait principalement dans les cinématiques… et dans le bench intégré qui font un usage poussé de l'effet de DoF et ont tendance à zoomer sur les cheveux de Lara. Les performances des GeForce n'étaient pas tant en retrait que ça dans les scènes classiques du jeu telles que celle que nous utilisons pour mesurer les performances avec Fraps.

Nous avons par ailleurs testé Tomb Raider en mode Ultra, soit sans TressFX, cet effet étant trop gourmand pour les cartes testés ici. L'effet des nouveaux pilotes dans notre cas est donc… nul, ce qui temporise quelque peu le gain de 60% annoncé par Nvidia. Le dernier patch qui corrige quelques petits bugs, impacte les performances légèrement à la baisse du côté des GeForce et légèrement à la hausse du côté des Radeon.


Comme expliqué ci-dessus, les performances des GeForce dans les scenes de jeu n'étaient pas mauvaises et bien que le dernier patch les réduise légèrement, la GeForce GTX 650 Ti Boost se place au niveau de la Radeon HD 7850.


Page 24 - Benchmark : Total War Shogun 2

Total War Shogun 2

Total War Shogun 2 a reçu un patch DirectX 11, développé en collaboration avec AMD. Il apporte entre autre un support de la tessellation et un effet de profondeur de champ de meilleure qualité.

Nous l'avons testé en mode DirectX 11, avec une qualité équilibrée et en MLAA. Le jeu est maintenu à jour via Steam.


Les Radeon sont ici plus à l'aise que les GeForce et la HD 7790 devance la GTX 650 Ti Boost.


Page 25 - Récapitulatif des performances

Récapitulatif
Bien que les résultats de chaque jeu aient tous un intérêt, nous avons calculé un indice de performances en nous basant sur l'ensemble de résultats et en attachant une importance particulière à donner le même poids à chacun des jeux. Nous avons attribué un indice de 100 à la Radeon HD 7770 :


Le GPU Bonaire que la Radeon HD 7790 embarque lui permet d'afficher des performances en hausse de 30% par rapport à la Radeon HD 7770, de quoi se rapprocher de la Radeon HD 7850, sans toutefois atteindre son niveau de performances, qui reste 20% plus élevé. La Radeon HD 7790 Dual-X OC de Sapphire affiche un gain d'un peu plus de 5% sur la carte de référence.

La GeForce GTX 650 Ti Boost, principalement grâce à un bus mémoire plus large, devance la GeForce GTX 650 Ti de plus de 25%, terminant à 15% de la GeForce GTX 660 qui dispose d'une puissance de calcul 20% supérieure. La GeForce GTX 650 Ti Boost devance également la Radeon HD 7790 d'un peu plus de 10% en moyenne, mais reste derrière la Radeon HD 7850 bien qu'elle puisse l'égaler, voire la devancer, dans quelques jeux.

Rappelons que nous avons fait en sorte de tester la GeForce GTX 660 et la GeForce GTX 650 Ti Boost à leurs spécifications minimales garanties au niveau de GPU Boost. Nous avons pour cela joué avec les paramètres d'overclocking de manière à ce que la fréquence en pratique corresponde bien à celle d'une carte dont la fréquence turbo maximale serait la fréquence GPU Boost officielle. Insistons bien sur le fait que cela ne revient pas à désactiver GPU Boost ! Dans le cas de la GeForce GTX 660, fortement limitée par sa consommation, l'impact est insignifiant (< 1%), alors qu'il est compris entre 1 et 3% suivant les jeux pour la GeForce GTX 650 Ti Boost par rapport au potentiel maximal de notre échantillon de test.


Page 26 - Conclusion

Conclusion
Avec la Radeon HD 7790, AMD nous propose une mise à jour sympathique de la Radeon HD 7770. Le GPU Bonaire qu'elle embarque est plutôt efficace, particulièrement sur le plan énergétique, et permet un gain de performances significatif, de 30% en moyenne, pour faciliter l'utilisation de la résolution native des écrans 1080p. Bonaire introduit par ailleurs une petite évolution de l'architecture GCN ("1.1") qui concerne le GPU computing : si son impact est limité pour l'utilisateur final, cette évolution est importante dans le cadre de la mise à disposition aux développeurs d'une plateforme qui se rapproche de l'Heterogenous System Architecture (HSA).


Si la Radeon HD 7790 devance la GeForce GTX 650 Ti de 15%, elle est aussi plus chère depuis l'ajustement tarifaire opéré par Nvidia qui a visiblement décidé de la cerner par le bas mais aussi par le haut. Ainsi, la GeForce GTX 650 Ti Boost se place un peu plus de 10% devant la Radeon HD 7790 pour une dizaine d'euros de plus. Tout du moins en théorie puisque nous n'avons pu en tester que la version 2 Go. Il reste en effet à vérifier si la version 1 Go de la dernière carte graphique de Nvidia n'est pas limitée en performances, compte tenu de son organisation asymétrique de la mémoire qui fait que seuls 768 Mo sont accessibles à pleine vitesse.

Si la GeForce GTX 650 Ti Boost 2 Go parvient à égaler voire dépasser la Radeon HD 7850 2 Go dans quelques titres, la dernière est en moyenne plus performante, alors que la tarification est similaire. Une situation classique en terme de rapport performances/prix, un indice qui n'est pas privilégié par Nvidia qui estime, comme de nombreux utilisateurs, que son image de marque et quelques avantages logiciels exclusifs justifient une tarification relative plus élevée.


Autant les GeForce GTX 650 Ti Boost 1 Go que la Radeon HD 7790 sont mises dans une position difficile par rapport à la Radeon HD 7850 1Go qui représente le meilleur rapport performances/prix du moment. Selon AMD, cela serait par contre temporaire, et cette version de la Radeon HD 7850 serait vouée à disparaître suite à l'arrêt de la production des modules mémoires de faible densité qui permettent cette configuration. Une fois celle-ci épuisée, la Radeon HD 7790 et la GeForce GTX 650 Ti Boost 1 Go, pourraient ainsi sortir de son ombre. La Radeon HD 7790 OC de Sapphire, qui pour quelques euros de plus que le tarif de base permet de profiter de quelques points de performances supplémentaires et d'un ventirad discret pourrait notamment représenter un choix pertinent.

Il se trouve cependant que la version 1 Go de la GeForce GTX 650 Ti Boost repose sur l'utilisation des mêmes modules mémoire que la Radeon HD 7850 1 Go. Nvidia nous indique ne pas rencontrer de problème d'approvisionnement à leur niveau et que si cette variante 1 Go tarde à être disponible à la vente, cela ne saurait tarder et ne serait plus l'affaire que de quelques jours. Qui croire du coup ? AMD ne tenterait-il pas de trouver un prétexte à l'abandon d'une Radeon HD 7850 1 Go qui gêne une Radeon HD 7790 plus rentable ? Nvidia et ses partenaires comptent-t-ils réellement produire la GeForce GTX 650 Ti Boost 1 Go en quantité ? Nvidia se serait-il assuré l'accès exclusif aux derniers stocks de GDDR5 de faible densité ?

Quoi qu'il en soit, à l'heure actuelle, la Radeon HD 7850 1 Go à 150€ est disponible et représente le meilleur choix pour jouer sans se ruiner en 1080p, certes avec quelques compromis sur la qualité graphique. Difficile de notre côté de savoir à quel niveau sont les stocks existants, ni jusque quand elle sera proposée.

Enfin, il faudra prendre en compte un dernier point : les bundles éventuels. Selon vos préférences, ils pourront faire pencher la balance en faveur de l'un ou l'autre produit… généralement à l'avantage de la Radeon HD 7850. Qu'elles soient en version 2 Go ou 1 Go, les Radeon HD 7850 sont ainsi proposées avec les excellents Tomb Raider et BioShock Infinite alors que la Radeon HD 7790 se contente du second. Du côté de la GeForce GTX 650 Ti Boost, Nvidia propose un pack Free-to-Play d'une valeur combinée de 55€ qui a reçu un accueil plutôt mitigé chez les joueurs.


Copyright © 1997-2019 HardWare.fr. Tous droits réservés.