HardWare.fr


Nvidia GeForce GTX 780 en test : GK110 pour tous (ou presque)
Cartes Graphiques
Publié le Jeudi 23 Mai 2013 par Damien Triolet

URL: /articles/894-1/nvidia-geforce-gtx-780-test-gk110-tous-ou-presque.html


Page 1 - Introduction

Nvidia prépare un rafraîchissement de sa gamme de cartes graphiques qui va passer de la série GeForce 600 à la série GeForce 700. Pour introduire celle-ci, Nvidia lance la GeForce GTX 780 qui n'est autre qu'une GeForce GTX Titan aux spécifications revues à la baisse. De quoi démocratiser quelque peu le plus gros GPU Kepler, le GK110, même si le ticket d'entrée restera élevé à son niveau : 650€ !


Collection printemps-été
C'est devenu une habitude, que de nouveaux GPU soient disponibles ou pas, chaque année à droit à sa nouvelle famille de cartes graphiques. En l'absence de réelle nouveauté nous avons en général droit à un renommage ou à des dérivés aux spécifications (fréquences, unités actives…) revues à la hausse. Si AMD a dérogé à la règle en augmentant la durée de vie des Radeon HD 7000, Nvidia respecte la tradition et lance des GeForce 700 basées sur les GPU Kepler déjà en exploitation.

L'énorme GPU GK110, jusqu'ici situé en dehors de toute famille de GeForce, intègre les GeForce GTX 700, de manière à pouvoir proposer une évolution significative pour la GeForce GTX 780 par rapport à la GeForce GTX 680, basée sur un GPU plus simple.

Nvidia en profite pour faire évoluer le profil de la carte de référence en privilégiant de manière claire des nuisances sonores aussi réduites que possible. Tout comme pour la GeForce GTX Titan, le turbo maison est calibré à cet effet et un système de refroidissement haut de gamme est exploité. Nvidia espère ainsi tirer la prestation par le haut et justifier des tarifications relativement élevées : le tarif d'introduction est ainsi de 650€ pour la GeForce GTX 780.


Mise en perspective, cette tarification est en hausse par rapport aux GeForce GTX x80 précédentes qui étaient généralement introduites à +/- 500€, suivant le taux de conversion euro-dollars. Vous remarquerez que la GeForce GTX Titan, tout comme la GeForce 8800 Ultra en son temps, représente une exception et se situe en dehors de la gamme classique.

Vous remarquerez également qu'une concurrence acharnée ou son absence peut avoir un impact non négligeable sur les prix. Nvidia avait ainsi dû modérer ses ambitions et rapidement revoir à la baisse le tarif des GeForce GTX 200 suite à des Radeon HD 4000 très agressives. Actuellement, AMD n'a pas de réponse à apporter dans le haut de gamme mono-GPU. En attendant la fin de l'année et l'arrivée de nouveaux GPU Radeon, Nvidia a le champ libre et ne compte pas se priver de l'exploiter.


Page 2 - Spécifications, la GeForce GTX 780

Spécifications

La GeForce GTX Titan, malgré son tarif de 1000€, doit se contenter d'un GK110 castré, même si légèrement. Pour faciliter sa production, Nvidia désactive ainsi l'un des 15 SMX (bloc fondamental de l'architecture Kepler) de la puce qui se contente donc de 2688 unités de calcul au lieu de 2880. Le bus mémoire est par contre complet et les unités de calcul double précision, contrairement aux précédents gros GPU de Nvidia, restent accessibles.

Pour la GeForce GTX 780, Nvidia a été un petit peu plus loin dans la désactivation d'unités et se contente de 12 SMX, mais en conservant également un bus mémoire complet. De quoi pouvoir récupérer un maximum de GK110 partiellement défectueux. Il est intéressant de noter que chaque groupe de 3 SMX est connecté à un rasterizer chargé de découper les triangles en pixels. Avec 12 SMX, plusieurs configurations sont donc possibles :

4 rasterizers : 4x 3 SMX
5 rasterizers : 3x 3 SMX + 1x 2 SMX + 1x 1 SMX
5 rasterizers : 2x 3 SMX + 3x 2 SMX

Ces configurations vont influencer le fillrate ou debit de pixels qui pourra être respectivement de 32, 36 ou 40 pixels par cycles. Nvidia estime que le fillrate est rarement le facteur limitant et que les écarts pratiques entre ces configurations possibles seront minimes. De notre côté, l'échantillon de test était de type 4x 3 SMX et disposait donc du fillrate le plus faible de 32 pixels par cycle, ce qui nous laisse penser que Nvidia n'a pas cherché à trier les échantillons presse à ce niveau.

Si la fréquence de base augmente quelque peu par rapport à la GTX Titan, la fréquence turbo pratique ne semble pas réellement augmenter avec la GeForce GTX 780. Le TDP est identique à la première : 250W, une valeur que le GPU ne pourra pas dépasser sous peine de voir sa fréquence descendre sous celle de base. Contrairement à la GTX Titan, la GTX 780 abandonne la limite de consommation intermédiaire (235W sur la GTX Titan) au-delà de laquelle le turbo ne pouvait s'enclencher. En pratique cela ne fait pas réellement de différence sur la carte de référence qui atteint sa limite de température bien avant d'arriver à 250W ou même 235W. Vous pourrez retrouver plus de détails sur le fonctionnement de ce turbo, dénommé GPU Boost, par ici.

Avec moins de SMX et une consommation relative qui en pratique sera en principe légèrement plus faible, la GeForce GTX 780 devrait en général pouvoir tourner à une fréquence légèrement supérieure à celle de la GTX Titan.

Contrairement à celle-ci, Nvidia se contente pour la nouvelle venue de 3 Go de GDDR5, une quantité de mémoire largement suffisante à l'heure actuelle. Le support du calcul rapide en double précision, utile au monde professionnel, est également désactivé sur la GeForce GTX 780. Enfin, notez que le GK110 reste limité au niveau de fonctionnalité 11_0 de DirectX, les Radeon sont toujours les seules à supporter le niveau 11_1.


La GeForce GTX 780 de référence
Nvidia nous a fourni une GeForce GTX 780 de référence :



A un petit détail près, Nvidia reprend pour la GeForce GTX 780 exactement le même design que pour la GTX Titan. Nvidia a pour rappel mis les bouchées doubles sur la finition du ventirad qui laisse de côté le mal aimé plastique au profit de matières plus nobles. De quoi pouvoir proposer un design très travaillé et assurer la robustesse sans faire exploser le poids de la carte graphique. Petit détail, le logo GeForce GTX est illuminé par des leds et cet éclairage peut être contrôlé pour en personnaliser le fonctionnement. La finition est réellement remarquable, tant visuellement qu'au toucher. Esthétiquement c'est un sans-faute.

Le ventirad vise également une efficacité élevée avec une large chambre à vapeur en cuivre nickelé, sur laquelle prend place un énorme radiateur. Pour utiliser tout l'espace disponible, Nvidia a place un second petit radiateur derrière le ventilateur radial. Une plaque en aluminium recouvre l'ensemble du PCB et isole les condensateurs pour éviter qu'ils entravent le flux d'air.


La carte propose une connectique classique avec 2 DVI Dual Link, une HDMI et une DisplayPort. Tout comme le GK104, le GK110 peut piloter jusqu'à 4 écrans simultanément. Pour alimenter le GK110, des connecteurs d'alimentations 8+6 broches sont nécessaires, ce qui est en phase avec le TDP de 250W de la carte. Nvidia a prévu 6 phases numériques sur son PCB, en plus des deux qui sont dédiées à la mémoire GDDR5 Samsung FC03 certifiée à 1.5 GHz.

De quoi arriver au détail qui diffère. Alors que la GeForce GTX Titan embarque 12 modules mémoire sur chaque face de son PCB, la face arrière de la GTX 780 en est dépourvue puisqu'elle se contente de 3 Go de mémoire au lieu des 6 Go de sa grande sœur.

Notez que la fréquence GPU Boost maximale de notre échantillon de GTX 780 est de 1006 MHz, une fréquence identique à celle de notre échantillon de GTX Titan.

Nvidia indique par ailleurs avoir revu légèrement le contrôleur du ventilateur (ce qu'il faut probablement traduire par l'algorithme qu'il exploite) de manière à lisser sa vitesse et réduire les petites variations. Nous avons pu observer que c'était bien le cas en pratique et la vitesse du ventilateur de la GTX 780 fluctue moins que celle de celui de la GTX Titan. En contrepartie, suite à un ventilateur qui du coup est moins réactif, dans certains conditions, la GTX 780 peut voir sa fréquence turbo chuter plus drastiquement avant de remonter progressivement.


Page 3 - Consommation, efficacité énergétique

Consommation
Nous avons utilisé le protocole de test qui nous permet de mesurer la consommation de la carte graphique seule. Nous avons effectué ces mesures au repos sur le bureau Windows 7 ainsi qu'en veille écran de manière à observer l'intérêt de ZeroCore Power. Pour la charge, nous avons opté pour des mesures dans Anno 2070, en 1080p avec tous les détails poussés à leur maximum, ainsi que dans Battlefield 3, en 1080p dans le mode High.


En charge la GeForce GTX 780 consomme légèrement moins que la GeForce GTX Titan, ce que nous attribuons à la mémoire différente puisque leur système de refroidissement est identique et limite de la même manière la consommation au niveau du GPU.

Pour rappel, lorsque nous démarrons nos tests de mesures de consommation, par exemple sous Anno 2070, les GTX Titan et 780 peuvent monter jusqu'à 225W, mais très rapidement, le GK110 va atteindre la limite de 80 °C et fréquences et tensions vont progressivement être abaissées. En d'autres termes, la consommation est nettement inférieure après quelques minutes de jeux, une fois la température GPU stabilisée.

Nous avons ensuite effectués les mêmes tests, mais en ajoutant 2 ventilateurs de 120mm de part et d'autre des GTX Titan et GTX 780. Cette fois, le GPU se stabilisé à un couple fréquence/tension plus élevé et la consommation monte quelque peu. Cela peut sembler contre-intuitif au premier abord, mais mieux la GTX Titan est refroidie, plus son niveau de consommation sera élevé. A 85 ou 90 °C le ventirad serait capable d'encaisser une charge plus élevée. Il en va de même pour un système de watercooling.

Notez que dans tous les cas, l'alimentation doit être adaptée au TDP de 250W, même si ce niveau de consommation n'est en pratique atteint que brièvement.

Nous avons mis en relation ces mesures de consommation avec les performances, en retenant des fps par 100W pour que les données soient plus lisibles :


[ Anno 2070 1080p Max ]  [ Battlefield 3 1080p High ]

A travers la GeForce GTX Titan, le GK110 s'avère être le GPU haut de gamme le plus efficace sur le plan énergétique, avec un net avantage dans Anno 2070 où la limite de température force le fonctionnement du GPU à une fréquence relativement faible. Rappelons que les turbos utilisés par Nvidia et AMD, s'ils permettent d'essayer de maximiser l'utilisation de l'enveloppe thermique disponible, le font au détriment de l'efficacité énergétique. Moins un turbo est capable de s'activer, meilleure elle sera.

La GeForce GTX 780 tournant en général à un couple tension/fréquence plus élevé que la GeForce GTX Titan, son rendement énergétique est légèrement inférieur.

Notons que chaque jeu représente un cas particulier et que le rendement varie d'un exemplaire de chaque carte à l'autre, parce que leur niveau de consommation réel varie et pour les GeForce parce que leur fréquence maximale et donc leurs performances varient.


Page 4 - Bruit et températures

Nuisances sonores
Nous plaçons les cartes dans un boîtier Cooler Master RC-690 II Advanced et mesurons le bruit d'une part au repos et d'autre part en charge. Un SSD est utilisé et tous les ventilateurs du boîtier ainsi que celui du CPU sont coupés pour la mesure. Le sonomètre est placé à 60cm du boîtier fermé et le niveau de bruit ambiant se situe à moins de 20 dBA, ce qui est la limite de sensibilité pour laquelle il est certifié et calibré.


La GeForce GTX 780 est encore un petit peu moins bruyante en charge que la GeForce GTX Titan, la référence en la matière, ce qui est probablement lié à la programmation revue du contrôleur de son ventilateur.

L'évolution est significative par rapport au système de refroidissement de la GeForce GTX 680 et la différence avec la Radeon HD 7970 GHz Edition est pour le moins abyssale !


Températures
Toujours placées dans le même boîtier, nous avons relevé la température du GPU rapportée par la sonde interne :


La GeForce GTX Titan dépasse légèrement sa limite de température dans notre test de charge (3DMark 11 Test 1), relativement lourd bien qu'il ne soit pas extrême. Son ventirad n'arrive pas à maintenir les 80 °C et la fréquence se stabilise au bout de 2-3 minutes à 837 MHz, soit la fréquence de base à partir de laquelle GPU Boost accepte de laisser monter la température.

La GeForce GTX 780 parvient à maintenir les 80 °C, mais tout juste, ce qui signifie qu'elle reste également limitée à sa fréquence de base de 863 MHz.

Voici ce que tout cela donne à travers l'imagerie thermique :


Radeon HD 7970 GHz Edition de référence
GeForce GTX Titan
GeForce GTX 780 de référence
GeForce GTX 680 de référence
  [ Repos ]  [ Charge ]
  [ Repos ]  [ Charge ]  [ Charge 106%/94°C ]
  [ Repos ]  [ Charge ]
  [ Repos ]  [ Charge ]

La GeForce GTX 780 se comporte comme prévu exactement comme la GeForce GTX Titan. Elles sont très bien refroidies, d'une part parce que leur ventirad est performant, d'autre part parce que leur limite de température de 80°C ne permet pas de tirer le maximum du GPU et donc d'atteindre une consommation élevée.

Sans overclocking mais en augmentant les limites de consommation et de températures, la charge augmente sensiblement, notamment au niveau de l'étage d'alimentation, qui tient cependant bon.


Page 5 - Performances théoriques : pixels

Notez que pour toutes les performances théoriques, les GeForce GTX tournaient à leur fréquence GPU maximale respective, à savoir 1110 MHz pour la GTX 680, 1097 MHz pour la GTX 660 et 1006 MHz pour les GTX 780 et GTX Titan.

Performances texturing
Nous avons mesuré les performances lors de l'accès à des textures de différents formats en filtrage bilinéaire : en 32 bits classique (8x INT8), en 64 bits "HDR" (4x FP16), en 128 bits (4x FP32), en profondeur de 32 bits (D32F) et en FP10, un format HDR introduit par DirectX 10 qui permet de stocker des textures HDR en 32 bits avec quelques compromis.


Les GeForce GTX sont capables de filtrer les textures FP16 à pleine vitesse contrairement aux Radeon qui compensaient jusqu'ici par une puissance de filtrage tellement supérieure, que même si elles devaient filtrer les textures FP16 à demi-vitesse, elles affichaient des débits proches des GeForce. Ce n'est plus le cas avec les GeForce GTX 600 qui prennent une avance considérable sur ce point. La GeForce GTX Titan ne fait qu'enfoncer le clou et devance la Radeon HD 7970 GHz de près de 50% sur ce point.

Notez cependant que dans ce test, les GeForce GTX 600 ont du mal à atteindre leur débit maximal alors que leur fréquence GPU est pourtant maximale.

Les Radeon HD 7700 et 7800 ont également du mal à atteindre leur maximum théorique, cette fois parce que PowerTune les en empêche en réduisant la fréquence GPU, estimant que le niveau de consommation est trop élevé lorsque leurs unités de texturing sont saturées. Ce n'est pas le cas pour les Radeon HD 7900.


Fillrate
Nous avons mesuré le fillrate sans et puis avec blending, et ce avec différents formats de données :


[ Standard ]  [ Avec blending ]

Le fillrate peut être vu comme le point faible du GK110. Ainsi, il n'augmente que très peu par rapport au GK104, un peu plus de 10% en théorie pour la GTX Titan et un petit peu moins en pratique. Pour rappel, les 14 SMX de la GeForce GTX Titan sont capables de transférer 56 pixels par cycle vers les ROP et ceux-ci sont capables d'en écrire 48 en mémoire par cycle, contre 32 et 32 pour une GeForce GTX 680. La limitation se situe en fait au niveau des rasterizers : le GK110 en dispose de 5 contre 4 pour le GK104. Chacun de ceux-ci étant capable de générer 8 pixels, le GK110 est en réalité limité à 40 pixels par cycle contre 32 pour le GK104. La différence de fréquence réduit encore cet écart.

Suivant sa configuration, la GeForce GTX 780 peut être limitée au niveau des rasterizers soit à 32, soit à 36, soit à 40 pixels par cycle. Notre échantillon de test était dans le premier cas et se retrouve donc avec un fillrate légèrement inférieur à celui d'une GeForce GTX 680.

Au niveau du fillrate, les GeForce GTX Kepler sont enfin capables de transférer les formats FP10/11 et RGB9E5 à pleine vitesse vers les ROP, bien que le blending de ces formats se fasse toujours à demi vitesse. Si les GeForce et les Radeon sont capables de traiter le FP32 simple canal à pleine vitesse sans blending, seules ces dernières conservent ce débit avec blending. Elles sont par ailleurs nettement plus rapides en FP32 quadruple canal (HDR 128 bits). Les GeForce semblent cependant faire un meilleur usage de leur bande passante mémoire disponible dans le cas du FP16 avec blending.

Bien que les Radeon 7800 disposent du même nombre de ROP que les Radeon HD 7900, leur bande passante mémoire inférieure ne leur permet pas de maximiser leur utilisation avec blending ainsi qu'en FP16 et FP32 sans blending.


Page 6 - Performances théoriques : géométrie

Notez que pour toutes les performances théoriques, les GeForce GTX tournaient à leur fréquence GPU maximale respective, à savoir 1110 MHz pour la GTX 680, 1097 MHz pour la GTX 660 et 1006 MHz pour les GTX 780 et GTX Titan.

Débit de triangles
Etant donné les différences architecturales des GPUs récents au niveau du traitement de la géométrie, nous nous sommes évidemment penchés de plus près sur le sujet. Tout d'abord nous avons observé les débits de triangles dans deux cas de figure : quand tous les triangles sont affichés et quand ils sont tous rejetés (parce qu'ils tournent le dos à la caméra) :


Les GeForce GTX 600 ne font pas mieux que les Radeon HD 7900/7800 lorsque les triangles doivent être rendus, peut-être parce qu'elles sont engorgées à un endroit ou à un autre, ou encore parce que leurs performances ont été réduites artificiellement pour différencier les Quadro des GeForce. La GeForce GTX Titan est par contre légèrement devant la Radeon HD 7970 GHz Edition.

Quand les triangles peuvent être éjectés du rendu, les GeForce GTX Titan, 780, 680 et 660 profitent pleinement de leur capacité de prise en charge de 7, 6, 4 ou 2.5 triangles par cycle pour prendre le large.

Ensuite nous avons effectué un test similaire mais en utilisant la tessellation :


Avec les GeForce GTX Kepler, Nvidia réaffirme sa supériorité lorsqu'il s'agit de traiter un nombre important de petits triangles générés par un niveau de tessellation élevé, les Radeon HD 7900 ne se démarquant pas des Radeon HD 7800 qui disposent du même nombre d'unités fixes dédiées à cette tâche.

L'architecture des Radeon fait qu'elles peuvent être engorgées par la quantité de données générées, ce qui réduit drastiquement leur débit dans ce cas. Le doublement de la taille du buffer dédié à l'unité de tessellation dans le GPU des Radeon HD 6800 leur a permis d'être significativement plus performantes que les Radeon HD 5000. AMD a continué dans cette voie avec les Radeon HD 7000.


Page 7 - FCAT, Protocole de test

Pourquoi nous n'utilisons pas FCAT pour l'instant
Depuis quelques mois, Nvidia distribue à la presse un outil de test dénommé FCAT, composé d'une carte d'acquisition pour enregistrer ce qui est affiché et l'écran et de scripts pour analyser tout cela. Le but est de mettre en avant des différences éventuelles au niveau du ressenti qui pourrait ne pas correspondre au niveau de fps moyen classique.

Nous avions pour rappel rassemblé nos différentes réflexions sur le sujet dans cet article. Notre avis n'a pas changé depuis : utiliser FCAT monopolise trop de temps sans apporter de réponse à la question de la fluidité. Nvidia est pourtant très insistant par rapport à son outil de test, conditionnant par exemple à son utilisation l'envoi d'une seconde GTX 780 pour des tests en multi-GPU.

Avec un temps de test limité, utiliser FCAT impliquerait de limiter le nombre de jeux testés, de simplifier les tests de bruit et de température et de ne pas pouvoir prendre le temps de tester les GeForce GTX Titan et GTX 780 en condition, c'est-à-dire à chaud. Par ailleurs, les résultats fournis par FCAT sont très spécifiques à un environnement donné (scène de test, pilotes, CPU etc) et peuvent de ce fait être moins représentatifs d'une situation globale qu'une moyenne de fps. Ne pas utiliser fcat nous semble ainsi être le meilleur compromis à l'heure actuelle.

La problématique de la fluidité est complexe. Elle dépend de plusieurs choses : le nombre de fps, la régularité de leur affichage, l'avancement régulier de la simulation par le moteur de jeu, le respect de l'avancement entre 2 images lors de leur affichage… Or FCAT ne mesure que la régularité d'affichage et les scripts de Nvidia sont prévus pour juger les cartes graphiques uniquement sur ce point sans chercher à savoir si cela a un impact sur la fluidité (à 120 fps, un affichage irrégulier pourra ne poser aucun problème alors qu'à 45 fps il pourra être dramatique). Par ailleurs, si la simulation par le jeu n'est pas régulière ou si elle n'est pas respectée à une étape du traitement, alors que le GPU ajoute des délais pour diffuser les images à un rythme régulier, le score FCAT sera parfait… mais pas la fluidité.

Cela ne veut pas dire que FCAT est inutile, la technique donne des informations supplémentaires, mais les scripts de Nvidia sont en grande partie inadaptés et l'analyse de ces informations demande de les mettre en correspondance avec le ressenti, la seule manière de savoir si un problème décelé par FCAT pose réellement problème. Dans le test de la Radeon HD 7990, nous en avions donc conclu qu'il était préférable de nous cantonner à ce ressenti.

En règle générale, nous observons soit un problème qui vient du moteur du jeu, soit un problème de cadence dans le cas du multi-GPU. Nous avons indiqué dans les pages qui suivent si le ressenti ne correspondait pas au niveau de fps moyen.


Protocole de test
Pour ce test, nous avons légèrement revu notre protocole, en y ajoutant Metro Last Light et en modifiant la manière de tester certains jeux : BioShock Infinite, Hitman Absolution, Sleeping Dogs et The Witcher 2. Nous avons dans les 3 premiers cas abandonné les benchmarks intégrés et dans le dernier une cinématique, au profit de scènes de jeu. Nous avons pu observer des différences significatives entre les résultats obtenus dans les jeux et certains benchmarks intégré, AMD et Nvidia tirant souvent la couette de leur côté au niveau de ces derniers lorsqu'ils travaillent avec les développeurs du jeu. Par ailleurs, certains benchmarks intégrés rendent difficile de laisser le GPU atteindre sa température de croisière.

Nous avons décidé de ne plus utiliser le niveau de MSAA (4x et 8x), comme critère principal pour segmenter nos résultats. De nombreux jeux au rendu différé proposent d'autres formes d'antialiasing, la plus courante étant le FXAA développé par Nvidia. Cela n'a donc plus de sens d'organiser un indice autour d'un certain niveau d'antialiasing, ce qui nous permettait par le passé de nous focaliser sur l'efficacité du MSAA. Nous avons mesuré les performances en 1920x108à avec un niveau de qualité extrême ainsi qu'en 2560x1600 avec un niveau de qualité en général quelque peu inférieur pour rester à un niveau jouable sur les cartes les plus rapides. Ce sont souvent les modes d'antialiasing les plus gourmands qui ont alors été désactivés.

Nous n'affichons plus les décimales dans les résultats de performances dans les jeux pour rendre les graphiques plus lisibles. Ces décimales sont néanmoins bien notées et prises en compte pour le calcul de l'indice. Si vous êtes observateurs vous remarquerez que c'est également le cas pour la taille des barres dans les graphes.

Toutes les Radeon ont été testées avec les pilotes Catalyst 13.5 beta2 et toutes les GeForce ont été testées avec les pilotes beta 320.18 en forçant l'activation du PCI Express 3.0 sur la plateforme X79. Tous les jeux sont testés avec leur dernier patch, la plupart étant maintenus à jour via Steam/Origin.

Nous avons testé les GeForce GTX Titan et GTX 780 dans 2 conditions différentes compte tenu de la limitation forte de leur turbo par rapport à la température GPU. Tout d'abord, avec une température ambiante de 26 °C, nous avons pris le temps de laisser ces GPU atteindre leur température / fréquence de croisière, sans quoi leurs performances dans un test bref seraient surestimées et non représentatives des performances réelles en jeu.

Nous n'avons pas cherché à limiter la fréquence turbo maximale (elle varie d'un échantillon à l'autre et la presse est en général bien fournie) dans ce test, puisque de base la valeur minimale (fréquence GPU Boost officielle) annoncée par Nvidia est rarement dépassée.

Dans un premier temps les mesures se font sur une table de bench classique, ce qui représente un système refroidi correctement, sans plus, et dans un second temps en ajoutant 2 ventilateurs de 120mm (Noctua NF-P12) autour de la carte graphique. De quoi représenter cette fois les performances d'un bon échantillon, avec une fréquence turbo maximale élevée, placé dans un environnement très bien refroidi.

Précisons enfin qu'ajouter ces ventilateurs autour des Radeon HD 7000 ou des GeForce 600 n'a aucun impact sur leurs performances. La GeForce GTX 680 est testée à sa spécifications minimales garanties au niveau de GPU Boost. Insistons bien sur le fait que cela ne revient pas à désactiver GPU Boost !



Configuration de test
Intel Core i7 3960X (HT off, Turbo 1/2/3/4/6 cores: 4 GHz)
Asus P9X79 WS
8 Go DDR3 2133 Corsair
Windows 7 64 bits
Pilotes GeForce beta 320.18
Catalyst 13.5 beta2






Page 8 - GPU Boost dans les tests

GPU Boost en pratique
Comme indiqué à plusieurs reprises, les GeForce GTX Titan et GTX 780 sont capables d'atteindre leur fréquence turbo maximale tant que leur GPU n'atteint pas 80 °C. Il atteint cette température dans tous les jeux que nous avons testés, sur un banc de test, sans et avec un refroidissement additionnel (2x Noctua NF-P12) autour de la carte.

Si nous mesurions les performances d'une manière traditionnelle, nous obtiendrions des résultats plus élevés et non-représentatifs des conditions de jeux dans l'ensemble de nos tests. Nous avons donc dû prendre le temps d'observer en détail le comportement de ces cartes dans chaque jeu pour nous assurer de faire des mesures de performances en conditions représentatives.

Voici pour rappel 2 exemples mesurés lors du test initial de la GTX Titan avec Anno 2070 et Battlefield 3 avec un test rapide, un test à température stabilisée et le même test que ce dernier mais avec 2 ventilateurs de 120mm positionnés autour de la carte :

Anno 2070 : 75 fps -> 63 fps -> 68 fps
Battlefield 3 : 115 fps -> 107 fps -> 114 fps

La chute de performances une fois la température de croisière atteinte peut être considérable. Un refroidissement performant peut compenser en partie cette baisse, mais n'y a-t-il pas une contradiction et devoir rajouter du bruit pour compenser le fait qu'une carte graphique s'efforce de rester discrète à tout prix ? La température de 80 °C visée par Nvidia est relativement faible pour un GPU et il aurait peut-être été judicieux d'opter par exemple pour 85 °C et de calibrer le ventilateur en conséquence.

Voici les fréquences moyennes que nous avons observées en pratique pour les 2 scénarios retenus :




Page 9 - Benchmark : Alan Wake

Alan Wake

Alan Wake est un portage console plutôt bien exécuté et basé sur DirectX 9. Il a la particularité d'imposer l'utilisation du MSAA, nécessaire pour le rendu correct des herbes.

Nous utilisons les niveaux de qualité Maximum et High proposés par le jeu qui intègrent notamment du MSAA 8x et 4x. Nous effectuons un déplacement bien défini et mesurons les performances avec Fraps. Le jeu est maintenu à jour via Steam.


[ 1920x1080 ]  [ 2560x1600 ]

Très gourmand en bande passante mémoire, Alan Wake est en général favorable aux Radeon et la GTX 780 ne devance que légèrement la Radeon HD 7970 GE, d'autant plus si le MSAA 8x est activé.


Page 10 - Benchmark : Anno 2070

Anno 2070

Anno 2070 reprend une évolution du moteur d'Anno 1404 qui intègre un support de DirectX 11.

Nous utilisons les modes de qualité très élevée et maximale du jeu, qui complexifie les effets de post processing et augmente le niveau de filtrage anisotrope. Nous effectuons un déplacement sur une carte et mesurons les performances avec Fraps.


[ 1920x1080 ]  [ 2560x1600 ]

Dans Anno 2070, c'est avant tout la puissance de calcul qui compte et les GPU sont mis à rude épreuve par rapport à leurs limites de consommation ou de température. De quoi permettre à la Radeon HD 7970 GE de faire jeu égal avec la GeForce GTX 780.


Page 11 - Benchmark : Assassin's Creed 3

Assassin's Creed 3

Le dernier opus de la série des Assassin's Creed repose en version PC sur un moteur DirectX 11 qui supporte notamment la tessellation.

Nous poussons toutes les options à leur maximum avec soit du MSAA 4x soit du FXAA HQ. Nous mesurons les performances avec Fraps sur le niveau Boston.


[ 1920x1080 ]  [ 2560x1600 ]

Dans ce jeu, les GeForce sont un petit peu plus à l'aise que les Radeon et semblent être moins limitées au niveau du CPU.

Pour toutes les cartes, les performances chutent à 30 fps par endroits, ce qui empêche ce jeu d'offrir une fluidité parfaite.


Page 12 - Benchmark : Battlefield 3

Battlefield 3

Battlefield 3 repose sur le Frosbite 2, un moteur graphique qui fait toujours partie des plus avancés à ce jour. De type rendu différé, il supporte la tessellation et calcule l'éclairage via un compute shader.

Nous testons le mode Ultra et relevons les performances avec Fraps, sur un parcours bien défini. Le jeu est maintenu à jour via Origin.


[ 1920x1080 ]  [ 2560x1600 ]

La GeForce GTX 780 est ici assez proche de la GeForce GTX Titan, le jeu étant dans ces conditions (MSAA 4x) en partie dépendant de la bande passante mémoire.


Page 13 - Benchmark : BioShock Infinite

BioShock Infinite

BioShock Infinite est basé sur un moteur dérivé de l'Unreal Engine 3, qui a notamment été modifié au niveau de l'éclairage. Il supporte le matériel DirectX 10 et DirectX 11 avec certaines améliorations graphiques réservées à l'API plus récente : c'est le cas de plusieurs effets mis en place avec la collaboration d'AMD tels que les Contact Hardening Shadows, le HDAO et le Diffusion Depth of Field. Notez que ces 2 derniers effets font appel aux Compute Shaders.

Nous testons le mode Ultra avec DDoF et relevons les performances avec Fraps, sur une partie de la scène de bench intégrée au jeu, qui est assez représentative. Le jeu est maintenu à jour via Steam.


[ 1920x1080 ]  [ 2560x1600 ]

Les GeForce sont ici plus à l'aise et la GTX 780 prend une avance importante sur la HD 7970 GE.

Notez que peu importe la carte, quelques petites saccades se font sentir par moment.


Page 14 - Benchmark : Crysis 3

Crysis 3

Crysis 3 reprend le même moteur que Crysis 2 : le CryEngine 3. Ce dernier profite cependant de quelques petites évolutions telles qu'un support plus avancé de l'antialiasing : FXAA, MSAA et TXAA sont au programme, tout comme un nouveau mode appelé SMAA.

Ce dernier est une évolution du MLAA qui permet, optionnellement, de prendre en compte des données de type sous-pixels soit à travers la combinaison avec du MSAA 2x, soit avec une composante temporelle calculée à partir de l'image précédente. Le SMAA 1x est la simple évolution du MLAA, le SMAA 2tx utilise une composante temporelle et le SMAA 4x y ajoute le MSAA 2x. Notez qu'il ne faut pas confondre le SMAA 2tx proposé en mono-GPU avec le SMAA 2x proposé en multi-GPU, ce dernier utilisant du MSAA 2x sans composante temporelle. Nous avons opté pour le SMAA 2tx avec le mode de qualité très élevé ou élevé.

Nous mesurons les performances avec Fraps sur la version 1.3 du jeu.


[ 1920x1080 ]  [ 2560x1600 ]

Les GeForce s'en sortent relativement mieux que les Radeon, même si le jeu est très lourd pour tout le monde. Heureusement, son moteur se contente en général de 40 à 50 fps pour un bon confort du jeu, ce que les GeForce atteignent plus facilement.


Page 15 - Benchmark : DiRT Showdown

DiRT Showdown

Dernier né chez Codemaster, DiRT Showdown reprend une évolution légère du moteur DirectX 11 maison. En partenariat avec AMD, les développeurs ont mis en place un éclairage avancé qui prend en compte de nombreuses sources de lumière directes et indirectes ainsi qu'une approximation du rendu de type illumination globale. Ces options supplémentaires ont été activées avec le premier patch du jeu qui a donc été déployé sur notre système, le jeu étant maintenu à jour via Steam.

Pour mesurer les performances, nous poussons toutes les options graphiques à leur maximum. Nous utilisons Fraps sur l'outil de test intégré.


[ 1920x1080 ]  [ 2560x1600 ]

Cette fois, les Radeon sont nettement plus à l'aise que les GeForce et la HD 7970 GE se permet de battre la GTX Titan en 2560x1600.


Page 16 - Benchmark : Far Cry 3

Far Cry 3

Far Cry 3 est relativement lourd, notamment à travers les effets d'occultation ambiante, de filtrage des surfaces alpha et bien entendu à travers la MSAA 4x.

Pour mesurer les performances, nous poussons le niveau graphique au niveau ultra ou very high et activons le HDAO.

Notez que le SSAO, moins gourmand, propose un rendu immonde, alors que le HBAO produisait des artefacts par endroit avant le patch 1.5 et, même une fois corrigé, affiche un résultat qui se rapproche du SSAO, inférieur au HDAO. Le HBAO ayant été développé à l'origine par Nvidia alors que le HDAO l'a été par AMD, certains testeurs, incités dans ce sens par Nvidia, préfèrent comparer les GeForce avec HBAO aux Radeon avec HDAO. Nous estimons cependant que cette approche n'est pas correcte, le HBAO étant moins gourmand et offrant un résultat inférieur, tout du moins dans ce jeu.

Nous utilisons Fraps sur un parcours bien défini.


[ 1920x1080 ]  [ 2560x1600 ]

Les GeForce se comportent nettement mieux en 1920x1080 avec MSAA qu'en 2560x1600 sans MSAA, où les Radeon reviennent dans la course.

Notez qu'à niveau de fps similaire, dans certains endroits (transitions intérieur – extérieur du village par exemple), le rendu est légèrement moins fluide sur Radeon que sur GeForce. Dans tous les cas, la fluidité dans Far Cry 3 est au mieux assez bonne, mais jamais parfaite, ce qui est lié à son moteur.


Page 17 - Benchmark : Hitman Absolution

Hitman Absolution

Hitman Absolution utilise un moteur plutôt lourd et qui manque probablement d'optimisations. La charge CPU est par ailleurs relativement élevée dans certaines scènes dans lesquelles une foule importante peut être animée. Différents effets DirectX 11 ont été intégrés avec la coopération d'AMD.

Pour mesurer les performances, nous poussons les options graphiques au niveau ultra et utilisons fraps dans le jeu.


[ 1920x1080 ]  [ 2560x1600 ]

Les GeForce GTX 780 et surtout Titan sont en partie limitées par le CPU en 1920x1080.


Page 18 - Benchmark : Max Payne 3

Max Payne 3

Max Payne 3 présente un rendu globalement réussi, bien qu'inégal par endroit, notamment à cause de textures de "qualité console". Il repose sur un moteur DirectX 11 au rendu différé qui supporte plusieurs effets avancés tels que le HDAO ou la tessellation, qui est plutôt lourde une fois poussée au maximum.

Il supporte le FXAA mais également le MSAA, très lourd compte tenu du type de rendu. Ce dernier reste cependant nécessaire pour venir à bout de tout l'aliasing.

Nous avons poussé toutes les options à leur maximum et utilisé Fraps sur un parcours bien défini. Le jeu est maintenu à jour via Steam.


[ 1920x1080 ]  [ 2560x1600 ]

Dans ce jeu, ce sont les GeForce qui ont l'avantage.


Page 19 - Benchmark : Metro Last Light, PhysX

Metro Last Light

Tout comme Metro 2033, sa suite Last Light développée par 4A Games est très gourmande. Elle repose sur une petite évolution du moteur DirectX 11 maison, le 4A Engine, ainsi que sur des environnements et éclairages plus riches. Le jeu pousse par ailleurs plus loin l'utilisation de la tessellation, autant sur les personnages que sur les objets ou les sols, même si dans bien des cas la différence n'est cependant pas transcendante.

Au niveau de l'antialiasing, le 4A Engine support l'AAA, un algorithme maison similaire au FXAA/MLAA/SMAA, ainsi que le SSAA extrêmement gourmand en mode 2x, 3x et 4x. Un mode 0.5x est également proposé et consiste alors à rendre le jeu dans une résolution inférieur qui est par la suite étendue.

Le support de GPU PhysX est toujours de la partie. A ne pas confondre avec PhysX, qui gère globalement la physique au niveau du CPU, il s'agit d'effets accélérés par le GPU à travers une librairie propriétaire de Nvidia, ce qui implique qu'ils ne peuvent pas être accélérés sur une Radeon. Ils sont alors traités par le CPU, d'une manière non-optimisée, ce qui rend leur utilisation impossible.

Nous avons testé le jeu via Fraps sur un parcours bien défini. Nous avons dû faire l'impasse sur le SSAA, même avec des cartes graphiques haut de gamme.


[ 1920x1080 ]  [ 1920x1080 GPU PhysX ]  [ 2560x1600 ]

En attendant des pilotes optimisés chez AMD, et bien que le dernier patch du jeu ait amélioré les choses, les GeForce restent nettement plus efficaces que les Radeon dans le dernier Metro. Tout du moins en 1920x1080 et en qualité maximale puisque les Radeon se comportent bien mieux en 2560x1600 en qualité un petit peu plus faible.

Avec GPU PhysX, comme prévu, les performances de la Radeon se retrouvent bridées par le CPU.


Page 20 - Benchmark : Sleeping Dogs

Sleeping Dogs

Sleeping Dogs nous propose un environnement hongkongais qui peut s'avérer être très gourmand pour nos cartes graphiques dès que les options de son moteur DirectX 11 sont poussées à leur maximum en combinaison avec un antialiasing avancé.

Nous utilisons fraps sur une scène du jeu, ce dernier étant maintenu à jour via Steam et donc en version 1.5 pour ce test. Le pack de texture HD a bien entendu été installé. Le niveau de qualité extrême est utilisé. L'aliasing géométrique est très important dans ce jeu, ce qui rend l'utilisation d'un antialiasing avancé préférable, du SSAA 2x voire du SSAA 4x en combinaison avec le FXAA.


[ 1920x1080 ]  [ 2560x1600 ]

Si les GeForce s'en tirent très bien dans le benchmark intégré, dans le jeu en lui-même, leurs performances reculent quelque peu, ce qui laisse l'avantage à la Radeon HD 7970 GE.


Page 21 - Benchmark : The Witcher 2 EE

The Witcher 2 Enhanced Edition

The Witcher 2 est un jeu dont le moteur graphique a été peaufiné progressivement, pour en arriver à la récente Enhanced Edition. Bien que basé sur DirectX 9, il est relativement gourmand une fois toutes ses options graphiques poussées au maximum, l'une d'elles étant particulièrement gourmande : l'UberSampling. Il s'agit en réalité d'un antialiasing de type supersampling 4x avec quelques optimisations.

Nous avons testé le jeu en qualité ultra sans l'Ubersampling ainsi qu'en qualité moyenne. Les performances sont mesurées avec Fraps.


[ 1920x1080 ]  [ 2560x1600 ]

Comme souvent, la Radeon HD 7970 GE se positionne mieux en 2560x1600 qu'en 1920x1080.

Notez qu'il peut être difficile d'obtenir une bonne fluidité dans ce jeu qui a tendance à souffrir de saccades autant sur les Radeon que sur les GeForce. Notre impression est que le moteur du jeu avance la simulation sur une base fixe de 60 fps et que quand le niveau de performances passe sous cette barre, il rattrape le retard toutes les quelques images, ce qui cause des saccades. En 2560x1600, aucune carte n'a proposé un rendu fluide alors qu'en 1920x1080, la Radeon HD 7970 GE et les GeForce GTX 780 et Titan se comportaient bien. La GeForce GTX 680 souffrait par contre toujours de quelques saccades alors que le jeu était totalement injouable sur la GTX 660 qui affiche pourtant 49 fps !


Page 22 - Benchmark : Tomb Raider

Tomb Raider

Tomb Raider est l'une des meilleures surprises de ce début d'année. Le rendu graphique est plutôt réussi, AMD ayant travaillé avec le développeur pour s'assurer d'une version PC de bon niveau. C'est particulièrement le cas pour TressFX, l'option de rendu avancé des cheveux de Lara qui apporte une bonne dose de réalisme.

Nous avons testé Tomb Raider en mode de qualité Ultime, avec SSAA 2x et FXX et mesuré les performances avec Fraps, sans utiliser le bench intégré qui correspond plus aux cinématiques qu'aux scènes de jeu classiques.


[ 1920x1080 ]  [ 2560x1600 ]

Suivant le refroidissement du système, la GeForce GTX 780 prend ici une avance relativement modérée par rapport à la Radeon HD 7970 GE.


Page 23 - Récapitulatif des performances

Récapitulatif
Bien que les résultats de chaque jeu aient tous un intérêt, nous avons calculé un indice de performances en nous basant sur l'ensemble de résultats et en attachant une importance particulière à donner le même poids à chacun des jeux. Nous avons attribué un indice de 100 à la GeForce GTX 680 :


[ 1920x1080 ]  [ 2560x1600 ]

Suivant le niveau de refroidissement du système, la GeForce GTX 780 affiche un gain de 20 à 25% sur la GeForce GTX 680 grâce à un niveau de performances qui correspond à 92% de celui d'une GeForce GTX Titan.

Par rapport à la Radeon HD 7970 GE, le gain moyen est de 12 à 15% suivant la résolution, tout du moins si la GeForce GTX 780 est exploitée dans un système très bien refroidi. Sans quoi elle se contente de 6 à 10% de mieux.

Mis à part Far Cry 3, dans lequel les GeForce se comportent légèrement mieux, et contrairement aux tests en multi-GPU, nous n'avons pas observé de différence au niveau du ressenti de la de fluidité entre GeForce et Radeon, autre bien entendu que liée au niveau de performances.


Page 24 - GPU Boost et overclocking

GPU Boost et overclocking
Pour illustrer le comportement de GPU Boost, nous avons effectué quelques mesures dans Metro Last Light en jouant avec différents paramètres à l'aide de Precision X.

L'offset GPU qui augmente la fréquence de chaque couple fréquence / tension. En plus de pousser la fréquence maximale, il revient à réduire la tension relative et facilite ainsi la montée en fréquence pratique. Notre GPU était stable avec un offset de 131 MHz.

La température cible de GPU Boost, limite au-delà de laquelle le turbo ne peut s'enclencher. Il faut noter que le ventilateur est calibré pour accélérer rapidement au-delà de 80 °C. En pratique le GPU n'atteint pas les 85 °C lorsque cette limite est fixée.

L'offset mémoire qui overclocke la GDDR5. Notre GTX 780 acceptait un offset de +300 MHz (= +600 MHz dans Precision X) pour passer de 1500 à 1800 MHz.

La tension maximale est par défaut de 1.1625V mais il est possible de la pousser à 1.2V, libérant ainsi 2-3 étapes supplémentaires pour GPU Boost.


Les fréquences GPU obtenues en pratique lors de la mesure de performances, de bas en haut, étaient de 863, 928, 954, 993, 1124, 1124 et 1150 MHz.

Augmenter la limite de température permet de faire progresser les performances de 10%, mais les nuisances sonores augmentent alors significativement. A moins de ne pas s'en soucier, en pratique, il ne suffira donc pas d'augmenter cette limite et il faudra revoir la calibration du ventilateur pour qu'il n'accélère qu'en douceur tant qu'il ne l'a pas atteinte.

Appliquer un offset sur la fréquence GPU, et donc réduire la tension relative, permet à la GTX 780 de gagner 7%, soit un petit peu plus que l'ajout du refroidissement supplémentaire.

En jouant avec les limites de températures et l'overclocking, il est possible d'atteindre un gain total dans les jeux de plus de 20%.


Page 25 - Conclusion

Conclusion
La GeForce GTX 780 est probablement un produit qui s'aborde sous plusieurs points de vue. Il s'agit d'une des meilleures cartes graphiques de référence qui soit passée entre nos mains : les performances sont au rendez-vous, notamment dans les jeux les plus lourds du moment tels que Metro Last Light, et son comportement est irréprochable au niveau des nuisances sonores. Par rapport à la GeForce GTX 680, elle réduit significativement le bruit généré par le système de refroidissement tout en augmentant les performances de 20 à 25%. Mieux, elle propose 92% des performances de la GeForce GTX Titan pour seulement 65% de son tarif, au risque de froisser les joueurs ayant fait l'acquisition de cette dernière.

Vue sous un autre angle, la GeForce GTX 780 voit son tarif progresser de plus de 40% par rapport à la GeForce GTX 680, pour atteindre 650€, un niveau inhabituellement élevé pour une carte de son calibre. Et par rapport à la concurrence, ce point de vue est encore moins flatteur puisque la nouvelle venue ne propose, en moyenne et selon les conditions, que 6 à 15% de performances en plus que la Radeon HD 7970 GHz Edition pour un tarif 50% plus élevé !


Le haut de gamme ne se juge cependant pas uniquement sur le plan du rapport performances / prix, même si nous aimerions le voir reprendre sa course vers le haut. Il représente ce qui se fait de mieux à un moment donné et cela implique toujours un surcoût. Par ailleurs, sans crainte de se faire devancer par AMD, qui ne pourra pas proposer de carte mono-GPU supérieure à la Radeon HD 7970 GHz Edition avant la fin de l'année, Nvidia a les mains libres sur le segment très haut de gamme. Ajoutez à cela le succès relatif de la GeForce GTX Titan à 1000€ et le tarif de la GeForce GTX 780 n'est pas si étonnant que cela.

Faut-il investir dans une carte aussi chère aujourd'hui ? Il y a bien entendu quelques jeux récents très gourmands pour lesquels elle peut être très utile, c'est le cas de Crysis 3 et Metro Last Light, mais dans la plupart des cas et avec quelques compromis sur la qualité graphique, un modèle nettement moins cher sera suffisant. Comme souvent, ce n'est pas la raison qui dirige vers l'achat d'un produit haut de gamme. A écouter la raison, sauf achat urgent, nous serions plutôt tentés d'attendre l'automne et de voir ce que prépare la concurrence avant de sortir le chéquier.

Notez à ce sujet que proposer des performances élevées et un rapport performances / prix n'est plus suffisant sur le haut de gamme. L'aspect nuisances sonores est important et il est temps qu'AMD réagisse. Une carte telle que la Radeon HD 7970 GHz Edition de référence, bien qu'en pratique elle ne se soit pas retrouvée dans le commerce, fait office de vitrine pour la gamme d'AMD et le moins que l'on puisse dire est qu'elle fait peine à voir au niveau des nuisances par rapport aux dernières GeForce haut de gamme !


Copyright © 1997-2020 HardWare.fr. Tous droits réservés.