Nvidia GeForce GTX 780 Ti en test : le GK110 enfin au complet ! - version imprimable

Nvidia GeForce GTX 780 Ti en test : le GK110 enfin au complet !
Cartes Graphiques
Publié le Jeudi 7 Novembre 2013 par Damien Triolet

URL: /articles/912-1/nvidia-geforce-gtx-780-ti-test-gk110-enfin-complet.html

Page 1 - Introduction

Nvidia n'aura pas tardé ! Inconcevable de laisser la première place à AMD alors que son GPU phare du moment, le GK110, a encore de la marge sous le coude. La GeForce GTX 780 Ti a dès lors pour mission de mettre tout le monde d'accord, quitte à éclipser une GeForce GTX Titan vouée à disparaître silencieusement…

Le GK110 au complet

Si le GPU GK110, Big Kepler, est exploité par Nvidia depuis quelques temps déjà, il n'était jusqu'ici représenté qu'en versions plus ou moins castrées, en dehors de la Quadro K6000.

Fabriquer un GPU de plus de 7 milliards de transistors en 28 nanomètres n'est pas une chose aisée et faire en sorte qu'une partie importante des échantillons produits soient pleinement fonctionnels est encore plus complexe. Depuis quelques temps, Nvidia a débuté la fabrication d'une nouvelle révision du GK110, la B1, destinée à améliorer la qualité de la production. Celle-ci est d'ailleurs déjà exploitée sur les GeForce GTX 780 et GTX Titan récentes. Grâce à cette nouvelle révision, et probablement à travers l'accumulation d'un petit stock de puces pleinement fonctionnelles, Nvidia est capable de lancer une GeForce GTX 780 Ti qui pousse le GK110 à son potentiel maximal dans le cadre ludique du jeu vidéo.

Voici les grandes lignes des implémentations différentes du GK110, rappelons que le SMX est la structure de base de l'architecture Kepler et englobe entre autre 192 unités de calcul et 16 unités de texturing :

GeForce GTX 780 : 12 SMX, 2304 unités de calcul
GeForce GTX Titan : 14 SMX, 2688 unités de calcul
GeForce GTX 780 Ti : 15 SMX, 2880 unités de calcul
Tesla K20 : 13 SMX, 2496 unités de calcul
Tesla K20X : 14 SMX, 2688 unités de calcul
Quadro K6000 : 15 SMX, 2880 unités de calcul

Ces unités de calcul supplémentaires, associées à une hausse des fréquences et des limites de PowerTune vont permettre à la GeForce GTX 780 Ti de reprendre le titre à la Radeon R9 290X...

Page 2 - Spécifications, la GeForce GTX 780 Ti

Spécifications

Depuis quelque temps nous hésitons sur la manière de qualifier la ou les fréquences des Radeon. Peut-on réellement parler de fréquence turbo lorsqu'il n'y a pas réellement de fréquence de base atteinte en pratique et à partir de laquelle le comportement du GPU change ? Quand il n'y a pas de fréquence minimale ? Dans le cas des GeForce GTX 600 et 700, le qualificatif de fréquence turbo semble logique alors que dans le cas d'une Radeon R9 280X, il l'est beaucoup moins. Nous avons donc décidé de faire le compromis de combiner fréquence turbo et fréquence maximale sur une même ligne et d'ajouter une fréquence de base à titre de référence lorsque cela fait sens. Le calcul des débits théoriques se fait cependant uniquement sur base des fréquences turbo/max (variable dans le cas des GeForce).

Dans le cas de la Radeon R9 290X, AMD indique que 727 MHz n'est pas une fréquence de base et qu'en réalité il n'y en a pas. Néanmoins, il s'agit de la fréquence à partir de laquelle il y a une rupture dans le comportement de la carte.

Par rapport à la GTX 780, la GTX 780 Ti profite d'une bande passante mémoire en hausse de 17% et d'une puissance de calcul qui progresse de près de 30% ! Un dernier point qui progresse un peu moins par rapport à la GTX Titan avec malgré tout 13% de mieux.

A noter que le calcul en double précision rapide n'est pas actif sur la GTX 780 Ti. Nvidia a partagé quelques détails de plus sur ce point en nous expliquant que toutes les unités de calcul double précision sont bien actives sur tous les dérivés du GK110 (960 dans le cas de la GTX 780 Ti) mais cadencées à une fréquence 8x moindre que les unités de calcul. Toujours dans le cas de la GTX 780 Ti, elles tournent donc à +/- 110-125 MHz ce qui explique leur débit réduit.

GeForce GTX 780 Ti de référence

Pour ce test, Nvidia nous a fourni une GeForce GTX 780 Ti de référence :

Nvidia reprend ici le même design que pour le ventirad des GeForce GTX 770, GTX 780 et GTX Titan de référence dont la qualité de finition est excellente et participe au bon comportement de ces cartes sur le plan des nuisances sonores.

Deux légères différences sont à noter : le logo GTX 780 Ti est renforcé à travers une surface brillante incrustée et le radiateur principal reçoit un revêtement foncé dont Nvidia n'a pas pu nous préciser s'il s'agissait uniquement d'un détail esthétique ou si cela était destiné à augmenter sa capacité de dissipation.

Bien que le TDP reste identique à 250W Le PCB a également été retravaillé au niveau de l'étage d'alimentation du GPU. Celui-ci reçoit 3 sources de 12V, via les deux connecteurs 8+6 broches ainsi que via le bus PCI Express, et pour la première fois, Nvidia l'a prévu de manière à pouvoir gérer l'équilibre entre ces 3 sources d'approvisionnement. De quoi éviter de dépasser la limite du bus PCI Express sans devoir brider la carte puisque le courant supplémentaire pourra venir des autres sources.

Page 3 - Consommation

Consommation

Nous avons utilisé le protocole de test qui nous permet de mesurer la consommation de la carte graphique seule. Nous avons effectué ces mesures au repos sur le bureau Windows 7 ainsi qu'en veille écran de manière à observer l'intérêt de ZeroCore Power d'AMD. Pour la charge, nous avons opté pour des mesures dans Anno 2070, en 1080p avec tous les détails poussés à leur maximum, ainsi que dans Battlefield 3, en 1080p dans le mode High.

En mode Quiet, la consommation totale de la Radeon R9 290X s'approche de 220W. Dans ces conditions, le GPU est cependant limité en fréquence dans les deux jeux testés (~940 MHz pour Battlefield 3 et ~870 MHz pour Anno 2070), sa température maximale et sa vitesse de ventilateur maximale étant rapidement atteintes. C'est la raison pour laquelle la consommation est identique dans ces deux jeux alors qu'Anno est nettement plus gourmand.

Fortement limitées par leur température cible de 80 °C, les GeForce GTX 780 et Titan se contentent de fréquences réduites ce qui limite ici leur consommation. Une GeForce GTX 780 capable de toujours maintenir sa fréquence maximale, telle que celle de MSI, va afficher une consommation similaire à celle de la nouvelle Radeon. Une fois passée en mode Uber, la Radeon R9 290X libère son GPU qui maintient 1 GHz dans Battlefield 3 et oscille entre cette même fréquence et 990 MHz dans Anno 2070. La consommation augmente cette fois assez nettement pour atteindre un nouveau record pour une carte de référence mono-GPU.

Avec une température cible et une vitesse de ventilateur plus élevée, la GeForce GTX 780 Ti profite d'une marge supplémentaire pour faire évoluer son GPU, ce qui la rend 20 à 30% plus gourmande que les GeForce GTX 780 et GTX Titan.

Notez que nous ne l'avons pas testée avec 2 ventilateurs supplémentaires, ce qui aurait donné un peu plus de marge dans Anno 2070, limité à la fréquence de base de la carte soit 876 MHz. Par contre nous avons testé un mode "Uber" dans lequel la carte voit ses limites levées (106% et 95 °C) et la consommation explose alors dans Anno alors qu'elle ne bouge pas dans Battlefield 3, situation où de base la carte tournait déjà à sa fréquence maximale.

Notez que nous avons fait l'impasse sur le rapport performances/watts qui n'a pas réellement de sens pour comparer les GPU lorsqu'il n'y a pas de différence technologique significative. Nous avons en effet constaté que la variation que nous pouvons observer d'un échantillon à l'autre pouvait rendre trompeuse ces données. Malgré sa consommation qui explose, le rendement énergétique de la Radeon R9 290X semble cependant en légère hausse sur base de notre échantillon.

Page 4 - Bruit et températures

Nuisances sonores

Nous plaçons les cartes dans un boîtier Cooler Master RC-690 II Advanced et mesurons le bruit d'une part au repos et d'autre part en charge sous le test1 de 3DMark11. Un SSD est utilisé et tous les ventilateurs du boîtier ainsi que celui du CPU sont coupés pour la mesure. Le sonomètre est placé à 60cm du boîtier fermé et le niveau de bruit ambiant se situe à moins de 20 dBA, ce qui est la limite de sensibilité pour laquelle il est certifié et calibré.

Plus de watts à dissiper pour un ventirad similaire se traduit mécaniquement par une hausse de nuisances sonores. La turbine tourne ainsi à 64% (2720 RPM) en charge et monte à 78% (3300 RPM) en mode "Uber". A ces niveaux la carte est bruyante mais reste cependant en dessous des nuisances sonores de la Radeon R9 290X, le compromis de Nvidia nous semble plutôt bon d'autant plus qu'à pression sonore équivalente, son ventirad est moins dérangeant que celui d'AMD. Nvidia a en effet travaillé en détail l'acoustique de manière à essayer de contenir les fréquences sonores qui nous agacent le plus.

Températures

Toujours placées dans le même boîtier, nous avons relevé la température du GPU rapportée par la sonde interne :

Force est de constater qu'AMD n'a pas choisi de sacrifier les nuisances sonores pour favoriser la température GPU qui correspond bien à la limite annoncée de 95 °C. En pratique Powertune s'efforce de ne pas dépasser 94 °C mais laisse facilement le GPU atteindre cette valeur. Nvidia se contente de s'en côté d'une légère hausse de la température entre une GTX 780 et une GTX 780 Ti.

Voici ce que tout cela donne à travers l'imagerie thermique :

GeForce GTX 780 de référence
GeForce GTX Titan de référence
GeForce GTX 780 Ti de référence
Radeon R9 290X de référence   [ Repos ]  [ Charge ]
  [ Repos ]  [ Charge ]  [ Charge 'Uber' - 106%/94°C ]
  [ Repos ]  [ Charge ]  [ Charge 'Uber' - 106%/95°C ]
  [ Repos ]  [ Charge Quiet ]  [ Charge Uber ]

Si le GPU de la R9 290X atteint rapidement les 94 °C, les divers composants du PCB n'en souffrent pas trop et l'étage d'alimentation principal, du GPU, est très bien refroidi malgré la charge énorme qu'il doit encaisser. L'étage d'alimentation chauffe plus du côté de la GTX 780 Ti, mais en restant à des températures raisonnables pour ce type de composants. De toute évidence Nvidia n'a par contre pas prévu cet étage d'alimentation pour des overclockings extrêmes, raison pour laquelle il n'est possible d'augmenter sa limite que de 6% contre 50% sur la Radeon.

Page 5 - Performances théoriques : pixels

Notez que par rapport à nos précédentes mesures théoriques, nous avons allongé la durée de nos tests de manière à ce que la fréquence GPU puisse se stabiliser en terme de consommation. Ils restent cependant suffisamment brefs pour ne pas être influencés par la température de manière à représenter les débits bruts des différents GPU. Nous avons repris leurs versions les plus performantes, excepté pour Tahiti pour lequel nous avons opté pour la Radeon R9 280X de manière à ce que tous les GPU AMD soient représentés à 1 GHz.

Performances texturing

Nous avons mesuré les performances lors de l'accès aux textures en filtrage bilinéaire activé et ce, pour différents formats : en 32 bits classique (8x INT8), en 64 bits "HDR" (4x FP16), en 128 bits (4x FP32), en profondeur de 32 bits (D32F) et en FP10, un format HDR introduit par DirectX 10 qui permet de stocker des textures HDR en 32 bits avec quelques compromis.

Les GeForce GTX sont capables de filtrer les textures FP16 à pleine vitesse contrairement aux Radeon, ce qui leur donne un avantage considérable sur ce point d'autant plus que leur architecture reposer sur une proportion plus importante d'unités de texturing par unités de calcul.

Notez que dans ce test, les GeForce à base de GK104/106/107 ont du mal à atteindre leur débit maximal dans ce test. Les Radeon peuvent également s'éloigner plus ou moins de leur maximum théorique, cette fois parce que PowerTune les en empêche en réduisant la fréquence GPU, estimant ou mesurant que le niveau de consommation est trop élevé lorsque leurs unités de texturing sont saturées. Ce n'est pas le cas pour les Radeon HD 7900 ni pour les Radeon HD 7800 (depuis la mise à jour de PowerTune en automne 2012), ni pour la Radeon HD 7790. La Radeon HD 7770 et la Radeon R9 290X sont par contre quelque peu limitées.

La GeForce GTX 780 Ti, contrairement à ce que laissent penser ses spécifications, a ici du mal à se détacher de la GeForce GTX Titan, car dans ce cas elle atteint sa limite de consommation.

Fillrate

Nous avons mesuré le fillrate sans et puis avec blending, et ce avec différents formats de données :

[ Standard ] [ Avec blending ]
Le fillrate est l'un des points forts du GPU Hawaii qui intègre pas moins de 64 ROP chargés d'écrire les pixels en mémoire. Tout comme pour Bonaire, ces ROP profitent qui plus est d'une efficacité supérieure avec blending. De quoi permettre un gain massif dans un exemple aussi simple que notre test qui tombe pour ces GPU dans le cas idéal.

À l'inverse, le fillrate peut être vu comme le point faible du GK110. Ainsi, il n'augmente que très peu par rapport au GK104, un peu plus de 10% en théorie pour la GTX Titan et un petit peu moins en pratique. Pour rappel, les 14 SMX de la GeForce GTX Titan sont capables de transférer 56 pixels par cycle vers les ROP et ceux-ci sont capables d'en écrire 48 en mémoire par cycle, contre 32 et 32 pour une GeForce GTX 680. La limitation se situe en fait au niveau des rasterizers : le GK110 en dispose de 5 contre 4 pour le GK104. Chacun de ceux-ci étant capable de générer 8 pixels, le GK110 est en réalité limité à 40 pixels par cycle contre 32 pour le GK104. La différence de fréquence réduit encore cet écart.

Suivant sa configuration, la GeForce GTX 780 peut être limitée au niveau des rasterizers soit à 32, soit à 36, soit à 40 pixels par cycle. Notre échantillon de test était dans le premier cas et se retrouve donc avec un fillrate légèrement inférieur à celui d'une GeForce GTX 680.

Au niveau du fillrate, les GeForce GTX Kepler sont enfin capables de transférer les formats FP10/11 et RGB9E5 à pleine vitesse vers les ROP, bien que le blending de ces formats se fasse toujours à demi vitesse. Si les GeForce et les Radeon sont capables de traiter le FP32 simple canal à pleine vitesse sans blending, seules ces dernières conservent ce débit avec blending. Elles sont par ailleurs nettement plus rapides en FP32 quadruple canal (HDR 128 bits).

Bien que les Radeon 7800 disposent du même nombre de ROP que les Radeon HD 7900, leur bande passante mémoire inférieure ne leur permet pas de maximiser leur utilisation avec blending ainsi qu'en FP16 et FP32 sans blending.

Etrangement la GTX 780 Ti est derrière la GTX Titan dans certains cas avec blending. Nos mesures sont pourtant correctes et là aussi nous présumons que la limite de consommation explique cela.

Page 6 - Performances théoriques : géométrie

Notez que par rapport à nos précédentes mesures théoriques, nous avons allongé la durée de nos tests de manière à ce que la fréquence GPU puisse se stabiliser en terme de consommation. Ils restent cependant suffisamment brefs pour ne pas être influencés par la température de manière à représenter les débits bruts des différents GPU. Nous avons repris leurs versions les plus performantes, excepté pour Tahiti pour lequel nous avons opté pour la Radeon R9 280X de manière à ce que tous les GPU AMD soient représentés à 1 GHz.

Débit de triangles

Étant donné les différences architecturales des GPU récents au niveau du traitement de la géométrie, nous nous sommes évidemment penchés de plus près sur le sujet. Tout d'abord nous avons observé les débits de triangles dans deux cas de figure : quand tous les triangles sont affichés et quand ils sont tous rejetés (parce qu'ils tournent le dos à la caméra) :

Quand les triangles peuvent être éjectés du rendu, les GeForce GTX 780 Ti, Titan, GTX 770 et GTX 660 profitent pleinement de leur capacité de prise en charge de 7.5, 7, 4 ou 2.5 triangles par cycle pour se démarquer des Radeon. Bonaire se comporte ici exactement comme Tahiti et Pitcairn alors que Hawaii passe à la vitesse supérieure mais sans pouvoir égaler le GK104.

Une fois que les triangles doivent être rendus, le débit maximal théorique des GeForce chute sur certains modèles alors que leur efficacité est plus généralement en baisse, peut-être parce que ces GPU sont engorgés à un endroit ou à un autre, ou encore parce que leurs performances ont été réduites artificiellement pour différencier les Quadro des GeForce. La Radeon R9 290X prend ainsi la tête sur ce point alors que le débit de la GTX 780 Ti est plus affecté que celui des autres GeForce, mais cette fois la limite de consommation n'est pas en cause..

Ensuite nous avons effectué un test similaire mais en utilisant la tessellation :

Avec les GeForce GTX Kepler, Nvidia réaffirme sa supériorité lorsqu'il s'agit de traiter un nombre important de petits triangles générés par un niveau de tessellation élevé. Les Radeon HD 7900/ R9 280X ne se démarquent pas des Radeon HD 7800 et de la Radeon HD 7790 qui disposent du même nombre d'unités fixes dédiées à cette tâche.

L'architecture des Radeon fait qu'elles peuvent être engorgées plus facilement par la quantité de données générées, ce qui réduit drastiquement leur débit dans ce cas. AMD fait évoluer progressivement les différents buffers liés à la tessellation, et la manière de les utiliser, pour éviter autant que possible de se trouver dans ce cas. Les derniers pilotes apportent d'ailleurs des gains significatifs à ce niveau pour l'ensemble des GPU GCN.

Hawaii affiche un gain important au niveau du débit brut, soit lorsque les triangles générés ne doivent pas être rendus. Lorsque c'est le cas, il se contente par contre dans notre test d'une progression de +/- 10% par rapport à Tahiti. Notre test étant relativement lourd en termes de données générées par triangles, nous supposons que le GPU souffre d'un embouteillage à un endroit ou à un autre, peut-être au niveau du canal de transfert de ces données vers les contrôleurs mémoire (mais pas directement au niveau de la bande passante globale qui est loin d'être saturée).

Page 7 - Protocole de test

Protocole de test

Pour ce test, nous avons retiré Assassin's Creed 3, The Witcher 2 et Battlefield 3 de notre protocole mais ajouté Splinter Cell Blacklist, Batman Arkham Origins et Battlefield 4. Tous ces jeux sont testés avec leur dernier patch au 05/11/2013, la plupart étant maintenus à jour via Steam/Origin/Uplay.

Nous avons opté pour un niveau de qualité aussi élevé que possible tant en restant jouable sur les cartes haut de gamme en 1920x1080 ainsi qu'en 2560x1440 et qu'en 4K.

Nous avons décidé de ne plus utiliser le niveau de MSAA (4x et 8x), comme critère principal pour segmenter nos résultats. De nombreux jeux au rendu différé proposent d'autres formes d'antialiasing, la plus courante étant le FXAA développé par Nvidia. Cela n'a donc plus de sens d'organiser un indice autour d'un certain niveau d'antialiasing, ce qui nous permettait par le passé de nous focaliser sur l'efficacité du MSAA.

Nous n'affichons plus les décimales dans les résultats de performances dans les jeux pour rendre les graphiques plus lisibles. Ces décimales sont néanmoins bien notées et prises en compte pour le calcul de l'indice. Si vous êtes observateur vous remarquerez que c'est également le cas pour la taille des barres dans les graphes.

Nous efforçons en général de n'utiliser qu'une seule version des pilotes, la plus récente, pour l'ensemble des cartes d'une même marque. Dans le cas présents, nous avons fait une exception étant donné que la proximité des sorties et l'arrivée successives de révisions mineures des pilotes ne permettait pas de retester toutes les cartes avec la dernière version des pilotes qui en général ne change rien du tout aux performances à l'exception d'un jeu particulier.

De manière à ce que les résultats soient strictement comparables, nous nous sommes cependant assurés qu'ils ne changeaient pas les performances et dans le cas contraire, toutes les cartes ont été retestées sur le jeu en question. C'est le cas uniquement pour les Radeon sur Tomb Raider, les Catalyst 13.11 beta8 réduisant légèrement les performances dans ce jeu par rapport à nos mesures précédentes.

En résumé voici les pilotes qui ont été utilisés :

Radeon R9 290 : 13.11b8
Radeon R9 290X/280X sur Tomb Raider et Battlefield 4 : 13.11b8
Radeon R9 290X/280X sur Batman AO : 13.11b6
Radeon R9 290X/280X sur les autres jeux : 13.11b6 en 4K et 13.11b5 en 1080p/1440p
GeForce GTX 780 Ti : 331.70
Autres GeForce GTX sur Tomb Raider, Battlefield 4 et Batman AO : 331.65
Autres GeForce GTX sur les autres jeux : 331.65 WHQL en 4K et 331.58 en 1080/1440p

Nous avons forcé l'activation du PCI Express 3.0 sur la plateforme X79 pour les GeForce.

Comme pour nos précédents tests, nous faisons en sorte de tester les différentes solutions en prenant en compte leur système de gestion de la consommation/fréquence/température de manière à vous proposer des résultats intéressants et pertinents. Notre approche à ce niveau n'est bien entendu pas rigide et nous l'adaptons suivant le produit testé.

Ainsi, cette fois, nous n'avons pas testé les GeForce GTX de référence avec 2 ventilateurs supplémentaires comme c'était le cas lors de leurs tests respectifs. A la place nous avons par contre intégré les résultats de GeForce GTX 780 et GTX 780 Ti que nous qualifierons d'Uber. Ces GeForce GTX "Uber" correspondent à des cartes capables de maintenir leur fréquence maximale (ou presque) en permanence comme ce serait le cas avec un kit de watercooling, en levant les limites de GPU Boost ou encore comme c'est exactement le cas pour de nombreux modèles partenaires pour la GTX 780, qui profite alors d'un système de refroidissement axial plus performant. Tout laisse penser que ce dernier point sera également vrai pour la GTX 780 Ti. Présenter les performances de tels modèles nous paraît être un meilleur compromis que l'ajout d'un refroidissement supplémentaire dans le cas présent, d'autant plus que la Radeon R9 290X Uber fait également en sorte de maintenir sa fréquence maximale.

Notez enfin que compte tenu de l'influence de la température sur les résultats, et du fait que nous mesurons les performances sur une table de benchs en prenant le temps de laisser la température/fréquence des différentes cartes se stabiliser, la température de la pièce a été contrôlée et fixée à 26 °C pour l'ensemble des tests.

Configuration de test

Intel Core i7 3960X (HT off, Turbo 1/2/3/4/6 cores: 4 GHz)
Asus P9X79 WS
8 Go DDR3 2133 Corsair
Windows 7 64 bits
Pilotes GeForce 331.58/65/70 WHQL
Catalyst 13.11 beta5/6/8

Page 8 - GPU Boost en pratique

GPU Boost en pratique

Comme les précédentes GeForce GTX, la GTX 780 Ti exploite une technologie de turbo et de contrôle de ses paramètres vitaux : GPU Boost.

GPU Boost fonctionne de la sorte sur la 780 Ti :

1. Le GPU monte à la fréquence maximale (qui est pour rappel variable d'un GPU à l'autre)
2. Si la consommation totale de la carte atteint 250W, tension et fréquence sont réduites par 0.0125V/13MHz
3. Le ventilateur accélère lentement jusqu'à 82 °C
4. Si le GPU atteint 83 °C, tension et fréquence sont réduites jusqu'à revenir à 82 °C
5. Si le GPU est descendu à sa fréquence de base de 876 MHz, la température peut monter au-delà de 83 °C

Notez que GPU Boost a évolué progressivement avec les générations de cartes graphiques. Avec les GeForce GTX 600, GPU Boost devait respecter une limite de consommation inférieure au TDP, sans quoi il devait se contenter de sa fréquence de base, et respecter une limite de température de 94 °C.

Avec la GeForce GTX Titan, Nvidia a mis en place une limite de température plus faible : 80 °C. La limite de consommation intermédiaire a cependant été conservée avec 235W pour un TDP de 250W. la limite de température, couplée à un système de refroidissement efficace permet de contenir les nuisances sonores.

Les GeForce GTX 700 ont simplifié l'ensemble en faisant disparaître la limite de consommation intermédiaire en ne conservant plus que le TDP. Par conséquent, c'est en général la température du GPU qui est l'unique paramètre dans la limitation des performances.

A noter que d'autres limites secondaires peuvent être utilisées, par exemple la GeForce GTX 780 ne peut accéder à son dernier couple fréquence/tension au-delà de +/- 75 °C. Ce n'est pas le cas sur GTX 780 Ti même s'il arrive que ce dernier pallier ne puisse être atteint, sans que nous ne sachions exactement pourquoi.

Avec GPU Boost, les performances peuvent varier d'un échantillon à l'autre, d'une part parce que la consommation réelle de chaque puce varie, ce qui va les amener plus ou moins vite dans les limites de consommation/température, et d'autre part parce que la fréquence maximale n'est pas définie mais différente pour chaque exemplaire. Nvidia refuse catégoriquement de communiquer une plage pour ces fréquences, se contenter de communiquer une fréquence GPU Boost officielle qui correspond à la fréquence "maximale minimale" mais n'a qu'un aspect décoratif puisqu'en dehors d'être reportées dans les différents outils, elle n'influence en aucune manière le GPU.

Contrairement au PowerTune d'AMD, GPU Boost est piloté non pas par le GPU mais bien par le pilote, il est donc moins réactif. Par ailleurs GPU Boost travaille sur des valeurs de consommation au niveau de la carte et non au niveau du GPU. C'est moins précis pour protéger ce dernier mais cela permet par contre de protéger la carte dans son ensemble et de contrôler précisément la consommation via chaque canal 12V, possibilité que Nvidia exploite pleinement grâce au nouvel étage d'alimentation de la GeForce GTX 780 Ti.

GPU Boost évoluant plus lentement et par pas plus importants que PowerTune, il est assez simple pour nous d'observer la fréquence moyenne approximative durant les tests. Voici ce que nous avons relevé :

[ 1920x1080 ] [ 2560x1440 ] [ 4K - 3840x2160 ]
Durant nos tests, effectués pour rappel après que les cartes soient montées en température et se soient stabilisées, la fréquence de la GTX Titan évolue entre 837 et 915 MHz, avec une moyenne de 863 MHz, assez éloignée de la fréquence maximale de 1006 MHz de notre échantillon.

La GeForce GTX 780 évolue entre 863 et 915 MHz, avec une moyenne de 876 MHz, contre une fréquence maximale de 1006 MHz. Quant à la GTX 780 Ti, sa fréquence varie entre 876 et 967 MHz pour une moyenne de 915 MHz, alors que notre échantillon peut monter jusque 1019 MHz.

Une fois en mode 'Uber', par exemple avec des limites de températures et de consommation poussées à leur maximum ou encore avec un système de refroidissement alternatif, les GeForce GTX 780 et GTX 780 Ti se rapprochent de leur maximum, voire y reste presque en permanence. Nous avons alors noté 993 MHz constant pour la GTX 780 et 1006/1019 MHz pour la GTX 780 Ti, ce qui apporte un gain de performances appréciable.

A noter dans le cas de la seconde que dans la plupart des tests sa consommation était très proche de la limite que nous avions pourtant repoussée à 106%, le maximum autorisé par Nvidia. C'est la raison pour laquelle sa fréquence passe régulièrement à 1006 MHz. Une baisse insignifiante mais qui indique qu'il y a très peu de marge disponible au niveau de la consommation et qu'un échantillon plus gourmand pourra être plus limité.

Page 9 - Benchmark : Alan Wake

Alan Wake

Alan Wake est un portage console plutôt bien exécuté et basé sur DirectX 9. Il a la particularité d'imposer l'utilisation du MSAA, minimum 2x, nécessaire pour le rendu correct des herbes.

Nous utilisons les niveaux de qualité maximale, élevée et faible proposés par le jeu, qui intègre respectivement du MSAA 8x, 4x et 2x. Nous effectuons un déplacement bien défini et mesurons les performances avec Fraps. Le jeu est maintenu à jour via Steam.

[ 1920x1080 ] [ 2560x1440 ] [ 4K - 3840x2160 ]
Les Radeon ont généralement l'avantage dans ce jeu relativement gourmand en bande passante mémoire, raison pour laquelle la Radeon R9 290 est ici très proche de la Radeon R9 290X Quiet.
L'avance des Radeon sur les GeForce est plus élevée avec MSAA 8x ainsi qu'en 4K, alors qu'elle se réduit en 2560x1440 avec MSAA 4x.

Page 10 - Benchmark : Anno 2070

Anno 2070

Anno 2070 reprend une évolution du moteur d'Anno 1404 qui intègre un support de DirectX 11.

Nous utilisons les modes de qualité maximale, très élevée et élevée du jeu. La qualité maximale complexifie les effets de post processing et augmente le niveau de filtrage anisotrope. Nous effectuons un déplacement sur une carte et mesurons les performances avec Fraps.

[ 1920x1080 ] [ 2560x1440 ] [ 4K - 3840x2160 ]
Dans Anno 2070, c'est avant tout la puissance de calcul qui compte et les GPU sont mis à rude épreuve par rapport à leurs limites de consommation ou de température. La Radeon R9 290X parvient malgré tout à conserver l'avantage en 1080p et en 4K mais la GTX 780 Ti passe devant en 1440p.

Page 11 - Benchmark : Batman Arkham Origins

Batman Arkham Origins

Dernier opus de la série, Batman Arkham Origins est toujours basé sur l'Unreal Engine 3 mais pousse un petit peu plus loin les effets graphiques dont certains ont été implémentés sur PC en collaboration avec Nvidia. C'est le cas du TXAA et d'effets GPU PhysX réservés aux GeForce (il n'est plus possible d'activer une version CPU de tous ces effets), mais également de l'occlusion ambiante de type HBAO+, d'un effet de Depth of Field plus évolué (NVDOF), d'ombres adoucies (PCSS) et de la tessellation (pour la cape et la neige) qui sont utilisables sur tous les GPU DirectX 11.

En 1920x1080 et 2560x1440, nous utilisons le mode de qualité maximale du jeu, avec du MSAA 8X et 4x. En 4K par contre, en plu de se contenter du FXAA, nous avons dû désactiver le HBAO+ pour nous contenter d'un effet d'occlusion ambiante moins lourd. Nous relevons les performances avec Fraps, sur un parcours bien défini. Le jeu est maintenu à jour via Steam.

[ 1920x1080 ] [ 2560x1440 ] [ 4K - 3840x2160 ]
Dans Batman, et avec les nouveaux pilotes qui apportent un net gain de performances, la Radeon R9 290X souffre moins que les GeForce quand le MSAA 8x est activé mais la GTX 780 Ti passe malgré tout devant. En 4K, les GeForce prennent très nettement la tête. Il est probable qu'AMD n'ait pas encore activé ses optimisations pour les résolutions multi-écrans, dont le 4K fait actuellement partie.

Page 12 - Benchmark : Battlefield 4

Battlefield 4

Battlefield 4 repose sur le moteur Frostbite 3, une évolution de la version 2 présente dans Battlefield 3. La base du rendu reste très proche (rendu différé, calcul de l'éclairage via compute shaders) et les évolutions visibles sont mineures, DICE ayant principalement optimisé son moteur pour les consoles de nouvelle génération. Parmi les petites nouveautés, citons un support plus avancé de la tessellation et une amélioration du module "destruction" du moteur.

Sur PC, seul le mode DirectX 11 est dorénavant proposé mais DICE a annoncé l'arrivée en décembre d'un mode Mantle. Pour rappel, il s'agit d'une API propriétaire de plus bas niveau dédiée aux Radeon HD 7000 et supérieures, qui a été développée par AMD et DICE.

Nous testons le mode Ultra en 1920x1080 ainsi qu'en 2560x1440 mais avons dû nous contenter du mode High en 2560x1440, avec SSAO au lieu du HBAO plus gourmand mais avec textures et filtrage Ultra pour conserver la netteté. Nous relevons les performances avec Fraps, sur un parcours bien défini et le jeu est maintenu à jour via Origin.

[ 1920x1080 ] [ 2560x1440 ] [ 4K - 3840x2160 ]
Le comportement des cartes est identique à celui observé dans Battlefield 3, si ce n'est que le niveau de performances est en baisse suite à la charge graphique plus élevée. A noter cependant que les Radeon se détachent moins des GeForce en 4K que dans l'épisode précédent.

La GeForce GTX 780 Ti prend ici une avance de +/- 10% sur la Radeon R9 290X.

Page 13 - Benchmark : BioShock Infinite

BioShock Infinite

BioShock Infinite est basé sur un moteur dérivé de l'Unreal Engine 3, qui a notamment été modifié au niveau de l'éclairage. Il supporte le matériel DirectX 10 et DirectX 11 avec certaines améliorations graphiques réservées à l'API plus récente : c'est le cas de plusieurs effets mis en place avec la collaboration d'AMD tels que les Contact Hardening Shadows, le HDAO et le Diffusion Depth of Field. Notez que ces 2 derniers effets font appel aux Compute Shaders.

Nous testons les modes Ultra avec DDoF ainsi que Very High et relevons les performances avec Fraps, sur une partie de la scène de bench intégrée au jeu. Le jeu est maintenu à jour via Steam.

[ 1920x1080 ] [ 2560x1440 ] [ 4K - 3840x2160 ]
Si les Radeon R9 290 sont très compétitives en 4K, dans les résolutions inférieures, la GTX 780 Ti prend une avance importante.

Notez que peu importe la carte, quelques petites saccades se font sentir par moment.

Page 14 - Benchmark : Crysis 3

Crysis 3

Crysis 3 reprend le même moteur que Crysis 2 : le CryEngine 3. Ce dernier profite cependant de quelques petites évolutions telles qu'un support plus avancé de l'antialiasing : FXAA, MSAA et TXAA sont au programme, tout comme un nouveau mode appelé SMAA.

Ce dernier est une évolution du MLAA qui permet, optionnellement, de prendre en compte des données de type sous-pixels soit à travers la combinaison avec du MSAA 2x, soit avec une composante temporelle calculée à partir de l'image précédente. Le SMAA 1x est la simple évolution du MLAA, le SMAA 2tx utilise une composante temporelle et le SMAA 4x y ajoute le MSAA 2x. Notez qu'il ne faut pas confondre le SMAA 2tx proposé en mono-GPU avec le SMAA 2x proposé en multi-GPU, ce dernier utilisant du MSAA 2x sans composante temporelle.

Nous mesurons les performances avec Fraps et le jeu est maintenu à jour via Origin.

[ 1920x1080 ] [ 2560x1440 ] [ 4K - 3840x2160 ]
Dans ce jeu très gourmand, les GeForce s'en sortent mieux que les Radeon en 1920x1080 et la GTX 780 Ti enfonce le clou.

Page 15 - Benchmark : Far Cry 3

Far Cry 3

Far Cry 3 est relativement lourd, notamment à travers les effets d'occultation ambiante, de filtrage des surfaces alpha et bien entendu à travers la MSAA 4x ou 2x.Pour mesurer les performances, nous activons le HDAO et poussons le niveau graphique au niveau ultra, à l'exception de la résolution 4K pour laquelle nous devons nous contenter du niveau medium (avec textures high).

Notez que le SSAO, moins gourmand, propose un rendu immonde, alors que le HBAO produisait des artefacts par endroit avant le patch 1.5 et, même une fois corrigé, affiche un résultat qui se rapproche du SSAO, inférieur au HDAO. Le HBAO ayant été développé à l'origine par Nvidia alors que le HDAO l'a été par AMD, certains testeurs, incités dans ce sens par Nvidia, préfèrent comparer les GeForce avec HBAO aux Radeon avec HDAO. Nous estimons cependant que cette approche n'est pas correcte, le HBAO étant moins gourmand et offrant un résultat inférieur, tout du moins dans ce jeu.

Nous utilisons Fraps sur un parcours bien défini.

[ 1920x1080 ] [ 2560x1440 ] [ 4K - 3840x2160 ]
La GeForce GTX 780 Ti reprend l'avantage dans ce jeu, avec une avance qui se réduit cependant quand la résolution augmente.

Notez qu'à niveau de fps similaire, dans certains endroits (transitions intérieur – extérieur du village par exemple), le rendu était légèrement moins fluide sur Radeon que sur GeForce, mais cela ne semble plus être le cas avec les pilotes récents. Dans tous les cas, la fluidité dans Far Cry 3 est au mieux assez bonne, mais jamais parfaite, ce qui est lié à son moteur.

Page 16 - Benchmark : GRID 2

GRID 2

Dernier né chez Codemaster, GRID 2 reprend une évolution légère du moteur DirectX 11 maison exploité par DiRT Showdown. Pour rappel, en partenariat avec AMD, les développeurs avaient mis en place un éclairage avancé qui prend en compte de nombreuses sources de lumière directes et indirectes ainsi qu'une approximation du rendu de type illumination globale. Ces techniques sont toujours exploitées, même si le partenaire principal de Codemaster est cette fois Intel qui a aidé à la mise en place d'optimisations spécifiques aux GPU intégrés à Haswell.

Pour mesurer les performances, nous poussons toutes les options graphiques à leur maximum, à l'exception de l'adoucissement de l'effet d'occlusion ambiante qui est désactivé en 4K. Nous utilisons Fraps sur l'environnement de Barcelone, le plus lourd dans le jeu.

[ 1920x1080 ] [ 2560x1440 ] [ 4K - 3840x2160 ]
La GTX 780 Ti passe devant la R9 290X, mais de peu en très hautes résolutions.

Page 17 - Benchmark : Hitman Absolution

Hitman Absolution

Hitman Absolution utilise un moteur plutôt lourd et qui manque probablement d'optimisations. La charge CPU est par ailleurs relativement élevée dans certaines scènes dans lesquelles une foule importante peut être animée. Différents effets DirectX 11 ont été intégrés avec la coopération d'AMD.

Pour mesurer les performances, nous poussons les options graphiques au niveau ultra et utilisons fraps dans le jeu.

[ 1920x1080 ] [ 2560x1440 ] [ 4K - 3840x2160 ]
La Radeon R9 290X prend ici l'avantage sur la GeForce GTX 780 Ti quand le MSAA est activé.

Page 18 - Benchmark : Max Payne 3

Max Payne 3

Max Payne 3 présente un rendu globalement réussi, bien qu'inégal par endroit, notamment à cause de textures de "qualité console". Il repose sur un moteur DirectX 11 au rendu différé qui supporte plusieurs effets avancés tels que le HDAO ou la tessellation, qui est plutôt lourde une fois poussée au maximum.

Il supporte le FXAA mais également le MSAA, très lourd compte tenu du type de rendu. Ce dernier reste cependant préférable pour venir à bout de tout l'aliasing particulièrement important dans les scènes intérieures de ce jeu.

Nous avons poussé toutes les options à leur maximum et utilisé Fraps sur un parcours bien défini. Le jeu est maintenu à jour via Steam.

[ 1920x1080 ] [ 2560x1440 ] [ 4K - 3840x2160 ]
Plus l'on monte en résolution, plus la Radeon R9 290X est compétitive. Du niveau des GeForce GTX Titan/780 en 1080p, elle égale presque la GTX 780 Ti en 4K.

Page 19 - Benchmark : Metro Last Light

Metro Last Light

Tout comme Metro 2033, sa suite Last Light développée par 4A Games est très gourmande. Elle repose sur une petite évolution du moteur DirectX 11 maison, le 4A Engine, ainsi que sur des environnements et éclairages plus riches. Le jeu pousse par ailleurs plus loin l'utilisation de la tessellation, mise en place en collaboration avec Nvidia, autant sur les personnages que sur les objets ou les sols, même si dans bien des cas la différence n'est cependant pas transcendante.

Au niveau de l'antialiasing, le 4A Engine support l'AAA, un algorithme maison similaire au FXAA/MLAA/SMAA, ainsi que le SSAA extrêmement gourmand en mode 2x, 3x et 4x. Un mode 0.5x est également proposé et consiste alors à rendre le jeu dans une résolution inférieur qui est par la suite étendue.

Le support de GPU PhysX est toujours de la partie. A ne pas confondre avec PhysX, qui gère globalement la physique au niveau du CPU, il s'agit d'effets accélérés par le GPU à travers une librairie propriétaire de Nvidia, ce qui implique qu'ils ne peuvent pas être accélérés sur une Radeon. Ils sont alors traités par le CPU, d'une manière non-optimisée, ce qui rend leur utilisation difficile en pratique.

Nous avons testé le jeu via Fraps sur un parcours bien défini. Nous avons dû faire l'impasse sur le SSAA, bien trop gourmand.

[ 1920x1080 ] [ 2560x1440 ] [ 4K - 3840x2160 ]
Les GeForce conservent un petit avantage en 1920, mais les Radeon reviennent quelque peu dans les plus hautes résolutions.

Page 20 - Benchmark : Sleeping Dogs

Sleeping Dogs

Sleeping Dogs nous propose un environnement hongkongais qui peut s'avérer être très gourmand pour nos cartes graphiques dès que les options de son moteur DirectX 11 sont poussées à leur maximum en combinaison avec un antialiasing avancé.

Nous utilisons fraps sur une scène du jeu, ce dernier étant maintenu à jour via Steam et donc en version 1.5 pour ce test. Le pack de texture HD a bien entendu été installé. Le niveau de qualité extrême est utilisé. L'aliasing géométrique est très important dans ce jeu, ce qui rend l'utilisation d'un antialiasing avancé préférable, du SSAA 2x voire du SSAA 4x en combinaison avec le FXAA.

[ 1920x1080 ] [ 2560x1440 ] [ 4K - 3840x2160 ]
La Radeon R9 290X devance ici la GTX 780 Ti mais cette avance se réduit quand la résolution augmente.

Page 21 - Benchmark : Splinter Cell Blacklist

Splinter Cell Blacklist

Basé sur le LEAD engine, une version retravaillée en interne de l'Unreal Engine 2.5, Splinter Cell Blacklist profite pour la version PC d'effets graphiques supplémentaires mis en place en collaboration avec Nvidia tels que le HBAO+, la tessellation ou encore le TXAA.

Notez au niveau de l'occlusion ambiante que le jeu propose de nombreuses options dans les plus avancées représentent l'effet le plus lourd du jeu. En 4K nous avons dû nous contenter de sa version la plus simple.

Nous mesurons les performances avec Fraps sur un parcours bien défini et le jeu est maintenu à jour via Uplay.

[ 1920x1080 ] [ 2560x1440 ] [ 4K - 3840x2160 ]
La GeForce GTX 780 Ti prend une avance significative en 1080p, mais elle se réduit en hautes résolutions. A noter que les GeForce préfèrent ici le MSAA aux très hautes résolutions.

Page 22 - Benchmark : Tomb Raider

Tomb Raider

Tomb Raider a été l'une des meilleures surprises de 2013. Le rendu graphique est plutôt réussi, AMD ayant collaboré avec les développeurs pour s'assurer d'une version PC de bon niveau. C'est particulièrement le cas pour TressFX, l'option de rendu avancé des cheveux de Lara qui apporte une bonne dose de réalisme.

Nous avons testé Tomb Raider en mode de qualité Ultime+ (Ultime + ombres ultra) en 1920 et en 2560 alors que nous nous sommes contenté du mode Ultra, sans TressFX, en 4K. Nous avons mesuré les performances avec Fraps, sans utiliser le bench intégré qui correspond plus aux cinématiques qu'aux scènes de jeu classiques.

[ 1920x1080 ] [ 2560x1440 ] [ 4K - 3840x2160 ]
Dans ce jeu, la GeForce GTX 780 Ti passe devant. A noter que par rapport aux chiffres obtenus lors de son lancement, les Radeon R9 290X voient leurs performances réduites de +/- 5% dans ce jeu avec les Catalyst 13.11b8, ce qui peut être lié à un bug ou à une nouvelle optimisation bénéfique dans certaines scènes mais pas dans d'autres.

Page 23 - Récapitulatif des performances

Récapitulatif

Bien que les résultats de chaque jeu aient tous un intérêt, nous avons calculé un indice de performances en nous basant sur l'ensemble de résultats et en attachant une importance particulière à donner le même poids à chacun des jeux.

Nous avons attribué un indice de 100 à la GeForce GTX 780 "Uber" qui correspond pour rappel à une GeForce GTX 780 capable de maintenir sa fréquence maximale comme c'est le cas de beaucoup de modèles proposés par les partenaires de Nvidia :

[ 1920x1080 ] [ 2560x1440 ] [ 4K - 3840x2160 ]
La GeForce GTX 780 Ti affiche en moyenne une avance de 4 à 6% sur la Radeon R9 290X Quiet, avance quelque peu plus élevée si nous en comparons les versions "Uber" avec jusqu'à 8% de gain. L'objectif de Nvidia est donc atteint.

Par rapport à la GeForce GTX 780, la GeForce GTX 780 Ti fait évoluer les performances en pratique de 15 à 20%, ce qui est plutôt sympathique pour ce qui n'est au fond qu'une évolution mineure de la première.

Page 24 - Conclusion

Conclusion

Même si l'avance sur la Radeon R9 290X reste mesurée, Nvidia reprend avec la GeForce GTX 780 Ti la première place en termes de performances pour peu que la 290X ne soit pas utilisée dans son mode Uber très bruyant. Un mode Uber peu supportable avec le refroidissement de référence AMD et qu'il est possible de contrecarrer en repoussant les limites fixées par Nvidia par défaut sur la 780 Ti pour en tirer encore plus de performances. Le nouveau haut de gamme d'AMD n'aura ainsi pu prétendre à la couronne que pendant 2 semaines, les deux concepteurs de GPU sont au coude à coude et aucun n'est prêt à laisser l'avantage à l'autre, d'autant plus quand Nvidia dispose d'un GPU dont toutes les capacités n'ont pas encore été exploitées.

Pousser plus loin son GPU GK110, signifie que Nvidia accepte de lui donner plus de marge de manœuvre sur le plan de la consommation, des nuisances sonores et des températures. Ces 3 valeurs sont en hausse sur la GeForce GTX 780 Ti, mais de façon très bien contrôlée d'autant plus que son système de refroidissement de luxe est un petit peu plus efficace au niveau de sa capacité d'étouffement du bruit qu'il génère. Même si l'augmentation de nuisances n'est jamais souhaitable, Nvidia s'en tire plutôt bien et reste loin d'une Radeon R9 290X dont il s'agit du principal défaut.

Première place du podium oblige, la tarification est adaptée en conséquence pour ce produit sans véritable défaut. Tout au plus pourrions-nous reprocher une absence de marge de manœuvre au niveau de son étage d'alimentation, ce qui ne permettra pas aux overclockeurs de tirer tout le potentiel de ce GPU sur base du design de référence. La GeForce GTX 780 Ti est introduite au tarif de 650€ avec un bundle de 3 jeux plutôt sympatiques : Assassin's Creed IV, Batman Arkham Origins et Splinter Cell Blacklist. Le rapport performances/prix reste en-dessous de celui de la Radeon R9 290X, mais n'est pas si éloigné que cela de celui de la GeForce GTX 780 qui est poussée depuis peu sous la barre des 500€.

Le point le plus délicat pour Nvidia est la comparaison avec la GeForce GTX Titan. Celle-ci reste proposée à son catalogue au tarif de près de 1000€, même s'il semble évident que Nvidia ne vas plus en fabriquer des quantités énormes. Pour la majorité des joueurs, elle n'aura plus aucun intérêt face à une GeForce GTX 780 Ti plus performante. Pour éviter de devoir en brader les stocks existants, Nvidia met cependant en avant le fait que la GTX Titan intègre 6 Go de mémoire et un support du calcul rapide en double précision comme sur ses cartes professionnelles. Deux points inutiles pour les joueurs même si une poignée de développeurs peuvent toujours y voir de l'intérêt.

Notez pour terminer qu'autant AMD que Nvidia mettent en avant l'arrivée de nouveautés qui visent directement les joueurs et qui ont le potentiel d'avantager leurs produits. Le premier avec Mantle, une API graphique optimisée pour l'architecture de ses GPU et le second avec G-SYNC, une technologie d'affichage qui apporte plus de fluidité à même niveau de performances, voir à niveau réduit. Reste qu'à l'état actuel des choses il s'agit de promesses et pour que cela se concrétise, il faudra qu'AMD parvienne à convaincre les développeurs de jeu et que Nvidia intègre sa technologie dans un maximum d'écrans. Deux sujets pour lesquels nous attendons avec impatience d'en savoir plus.

Au risque de nous répéter, force est de constater qu'un peu de concurrence incite les deux fabricants de GPU à faire bouger les choses pour se démarquer l'un de l'autre, ce qui est au final bénéfique pour les joueurs PC.