Nvidia GeForce GTX 960 et GM206 : l'Asus Strix, l'Inno3D iChill Ultra et la MSI Gaming en test - version imprimable

Nvidia GeForce GTX 960 et GM206 : l'Asus Strix, l'Inno3D iChill Ultra et la MSI Gaming en test
Cartes Graphiques
Publié le Jeudi 5 Février 2015 par Damien Triolet

URL: /articles/932-1/nvidia-geforce-gtx-960-gm206-asus-strix-inno3d-ichill-ultra-test.html

Page 1 - Introduction

Après les GeForce GTX 980 et 970, Nvidia entame la démocratisation de son architecture Maxwell dans le milieu de gamme à travers l'introduction de la GeForce GTX 960, construite autour d'un nouveau GPU. De quoi venir secouer les Radeon R9 laissées seules sur le segment 200-250€ après l'arrêt des GeForce GTX 760 ? C'est ce que nous allons vérifier à travers le test des modèles Asus Strix, Inno3D iChill Ultra et MSI Gaming.

Des capacités réorientées pour remplacer la GTX 760

Nvidia a profité des derniers mois de 2014, ainsi que des soldes qui ont suivi, pour écouler le plus gros des stocks restant des GeForce GTX 760 et 770. Mais il était bien entendu évident que le segment 200-250€, très populaire, ne serait pas abandonné aux Radeon R9 280, 285 et 280X pour bien longtemps !

Après le GM204 pour le haut de gamme, les ingénieurs de Nvidia nous ont préparé un GM206, destiné à proposer l'architecture Maxwell de seconde génération là où le plus gros du volume se fait auprès des joueurs. Ce nouveau GPU est exactement un demi-GM204, dont il conserve toutes les fonctionnalités. De quoi réduire nettement les coûts de fabrication directs mais aussi indirects puisque cela signifie également qu'il est moins gourmand : il peut donc se contenter d'un PCB plus simple et d'un ventirad moins performant que pour des GeForce GTX 970 ou 980.

Pour la GeForce GTX 960, Nvidia a conçu une carte de référence qui reprend un ventirad à turbine similaire à celui exploité sur les GeForce GTX 660, 660 Ti, 670 et 760. Un design qui n'a jamais réellement convaincu la presse… ce qui n'a pas échappé à Nvidia qui a préféré le laisser de côté le temps des premiers tests au profit de modèles partenaires plus musclés dont de nombreuses variantes seront disponibles rapidement.

Faute de concurrence inquiétante, Nvidia n'a pas besoin de pousser ses derniers GPU vers une fréquence élevée pour laquelle ils ont de toute évidence été conçus. Nvidia peut donc être extrêmement conservateur sur les spécifications de référence, de manière à réduire au maximum les nuisances et la consommation, tout en offrant à ses partenaires une marge de manœuvre importante. Comme nous allons le voir, certains en profitent pleinement.

Page 2 - GM206: un demi GM204, 1024 unités, bus 128-bit

GM206 : 2.9 milliards de transistors

Avec Maxwell, nom de code sa dernière architecture en date, Nvidia continue l'effort entrepris lors du passage de Fermi vers Kepler, pour une meilleure efficacité énergétique. C'est d'autant plus nécessaire que le procédé de fabrication n'évolue pas et reste la même variante du 28 nanomètres de TSMC (HP) que pour l'ensemble des GPU précédents.

Pour rappel, voici la liste des GPU conçus par Nvidia en 28 nanomètres :

GK210 : ??
GK110 : 7.1 milliards de transistors pour 551 mm²
GM204 : 5.2 milliards de transistors pour 398 mm²
GK104 : 3.5 milliards de transistors pour 294 mm²
GM206 : 2.9 milliards de transistors pour 228 mm²
GK106 : 2.5 milliards de transistors pour 214 mm²
GM107 : 1.9 milliards de transistors pour 148 mm²
GK107 : 1.3 milliards de transistors pour 118 mm²
GK208 : 1.0 milliards de transistors pour 79 mm²

Le GM206 de Nvidia.
Un petit calcul rapide montre que les GPU les plus récents de Nvidia, dont les GM204 et GM206, affichent une densité de transistors un peu plus élevée que celle de ses premières puces fabriquées en 28 nm. Ceci peut s'expliquer par une petite évolution des règles de design et par un effort d'optimisation plus poussé mais aussi par la proportion de mémoire SRAM (plus dense que les autres circuits) qui peut être plus élevée.

Sur base de notre mesure de la taille du die, le GM206 n'est que légèrement plus gros que le GK106, Nvidia ayant notamment pu effectuer quelques économies en réduisant la taille du bus mémoire pour compenser l'ajouter d'unités de calcul et de nouvelles fonctionnalités.

Comme vous pouvez le voir, la GM206 présente une forme allongée, qui diffère de la forme carrée de la plupart des GPU haut de gamme. Un détail qui pourra avoir son importance lors de la mise au point du système de refroidissement, notamment quand ce dernier exploite des caloducs en contact direct. Il y a aura une orientation bien plus efficace que l'autre.

Un demi GM204

Pour rappel, alors que les GPU Kepler reposaient sur des blocs fondamentaux appelés SMX (Streaming Multiprocessor), qui contiennent unités de calcul et autres unités de texturing, ceux-ci sont appelés SMM dans le cas de la génération Maxwell. Ils ont subi un régime assez drastique afin de les simplifier suffisamment pour pouvoir en augmenter significativement le nombre.

Tout comme les SMX, les SMM sont organisés en petits groupes, appelés GPC (Graphics Processing Cluster). Chaque GPC inclus un moteur de rastérisation qui reçoit les triangles traités par les SMX/SMM, les découpes en pixels avec lesquels il forme de petits groupes qui sont renvoyés vers les SMX/SMM en vue de leur calcul. Voici une représentation visuelle du GM206 (notez que la représentation miniature des SMM est basée sur la version officielle qui n'est pas tout à fait correcte, pour plus d'informations à leur sujet c'est par ici) :

Voici pour comparaisons les spécificités de tous les GPU 28 nm de la marque :

GK210 : 5 GPC, 15 SMX, 48 ROP, bus 384-bit, 1536 Ko de L2
GK110 : 5 GPC, 15 SMX, 48 ROP, bus 384-bit, 1536 Ko de L2
GM204 : 4 GPC, 16 SMM, 64 ROP, bus 256-bit, 2048 Ko de L2
GK104 : 4 GPC, 8 SMX, 32 ROP, bus 256-bit, 512 Ko de L2
GM206 : 2 GPC, 8 SMM, 32 ROP, bus 128-bit, 1024 Ko de L2
GK106 : 3 GPC, 5 SMX, 24 ROP, bus 192-bit, 384 Ko de L2
GM107 : 1 GPC, 5 SMM, 16 ROP, bus 128-bit, 2048 Ko de L2
GK107 : 1 GPC, 2 SMX, 16 ROP, bus 128-bit, 256 Ko de L2
GK208 : 1 GPC, 2 SMX, 8 ROP, bus 64-bit, 512 Ko de L2

Alors que le GM107 était passé à 1 Mo de L2 par contrôleur mémoire de 64-bit, les GM204 et GM206 s'en contentent de 512 Ko, soit 2 Mo et 1 Mo au total pour ces 2 GPU. Par contre, Nvidia est passé de 8 à 16 ROP par contrôleur mémoire, de quoi booster largement le fillrate, ce qui profite notamment aux plus hautes résolutions.

Pour éviter d'être trop limité par le bus mémoire relativement étroit des GM204/GM206, et la bande passante qui y est liée, Nvidia a amélioré quelque peu ses techniques de compression sans perte du framebuffer. Plus spécifiquement, c'est le codage différentiel pour les couleurs, également appelé compression delta, qui progresse, exactement comme l'a fait AMD avec Tonga.

Le principe de base consiste à ne pas enregistrer directement la couleur mais sa différence par rapport à une autre qui fait office de repère. Ce n'est bien entendu utile que quand l'écart entre deux couleurs est suffisamment faible, de manière à ce que cette information représente moins de bits que la couleur en elle-même. Ce type d'approche est exploitée depuis plusieurs générations de GPU mais les nouvelles puces Maxwell profitent d'un algorithme plus flexible, capable de profiter de cette compression dans plus de cas.

Avec la seconde génération Maxwell, Nvidia a eu un petit peu plus de temps pour implémenter de nouvelles fonctionnalités. Le GM206 est sur ce point totalement identique au GM204.

Elles s'articulent principalement autour de la mise à jour des moteurs de rastérisation, ces unités chargées de la découpe des triangles en pixels. Une limitation à leur niveau (absence de support de la fonction Target Independant Rasterization) empêchait jusqu'ici Nvidia de supporter le niveau de fonctionnalité matériel 11_1 de Direct3D bien que la plupart de ses autres spécificités soient bien supportées sur les GPU Kepler et Maxwell de première génération.

Nvidia n'a pas simplement ajouté ce qui manquait au support du niveau 11_1 mais a fait en sorte de faire le maximum pour s'assurer du support du prochain niveau, dont le numéro n'est pas encore connu (11_3 ? 12_0 ?). Celui-ci sera supporté par Direct3D 12 ainsi que par Direct3D 11.3 qui apportera l'équivalent sur l'API classique de Microsoft, tous les développeurs n'étant pas prêts à migrer vers la nouvelle API de bas niveau.

Tant qu'à modifier les moteurs de rastérisation sur plusieurs points, Nvidia en a profité pour améliorer leur flexibilité par rapport aux grilles d'échantillonnage utilisées avec l'antialiasing. Elles sont dorénavant capables de faire varier la position des samples d'une image à l'autre et/ou d'utiliser une grille multi-pixels. Cette seconde possibilité permet de répartir différemment les samples d'un pixel à l'autre pour éviter un schéma uniforme moins efficace.

Faire varier la position des samples, c'est déjà ce que faisais ATI et AMD avec le Temporal AA. Et c'est ce que va faire Nvidia avec le MFAA dont le support concerne la majorité des jeux DirectX 10/11 avec les derniers pilotes. Pour rappel, Nvidia ne s'est pas contenté de recopier ce principe d'ATI, mais y a ajouté un filtre plus avancé qui combine downsampling et composante temporale basée sur l'image précédente. De quoi se rapprocher du résultat d'un MSAA 4x avec seulement deux samples par pixel et un surcoût modéré pour le filtre qui permet au final au très bon compromis entre performances et qualité visuelle. Vous pourrez retrouver plus d'informations à ce sujet par ici

Nouveautés vidéo

Avec le GM204, Nvidia est passé au HDMI 2.0, qui apporte une hausse notable de bande passante afin de pouvoir gérer à l'instar du DisplayPort 1.2 les écrans 4K et 5K à 60 Hz sans avoir recours à un sous échantillonnage des informations de couleurs comme c'est le cas pour la 4K en HDMI 1.4a. A noter que chacun des 4 contrôleurs d'affichage est capable de gérer plusieurs flux MST de même résolution, ce qui permet par exemple d'utiliser un seul contrôleur pour adresser en DisplayPort un écran 4K "tiled" composé de deux dalles. Cela permet de gérer jusqu'à 4 écrans de ce type, à condition de disposer de 4 sorties DisplayPort (en pratique les fabricants en intègrent jusqu'à 3 à ce jour), contre 2 sur les cartes Nvidia précédentes.

Par contre le GM204 restait limité à 2 écrans en 5K, chaque contrôleur étant limité à la 4K dans le mode MST. Le GM206 corrige cela et chacun de ses 4 contrôleur peut dorénavant piloter un écran 5K en MST.

Côté vidéo et H.265 (HEVC), le GM204 profite du décodage hybride introduit avec les GTX 750/750 Ti et depuis étendu aux Kepler par les pilotes. Il s'agit en fait de réutiliser quand c'est possible certaines parties du décodeur matériel H.264 pour le décodage H.265, et quand ça ne l'est pas d'utiliser un décodage logiciel faisant appel aux unités de calcul du GPU.

Le GM204 ne dispose donc pas encore d'un décodeur H.265 complet, qui serait plus efficace côté énergétique, mais chose étonnante il intègre par contre un encodeur H.265 ! Celui-ci n'est pas encore utilisable via des pilotes, mais devrait profiter à terme aux applications de streaming telles que ShadowPlay.

Là aussi le GM206 va un petit peu plus loin et intègre cette fois un décodeur H.265 complet. Compte tenu de la proximité des 2 puces, il est probable que ce décodeur était également prévu pour le GM204 mais qu'un bug a poussé Nvidia à le désactiver pour ne pas retarder la sortie de ce GPU. Le GM206 a de son côté profité de quelques mois pour que tout cela soit peaufiné.

A noter que Nvidia en a profité pour assurer un support natif du protocole HDCP 2.2.

Page 3 - Performances théoriques : pixels

Performances texturing

Nous avons mesuré les performances lors de l'accès aux textures avec filtrage bilinéaire activé et ce, pour différents formats : en 32 bits classique (8x INT8), en 64 bits "HDR" (4x FP16), en 128 bits (4x FP32), en profondeur de 32 bits (D32F) et en FP10, un format HDR introduit par DirectX 10 qui permet de stocker des textures HDR en 32 bits avec quelques compromis.

Les GeForce GTX sont capables de filtrer les textures FP16 à pleine vitesse contrairement aux Radeon, ce qui leur donne un avantage considérable sur ce point. Notez que dans ce test, les GeForce à base de GK104/106/107 ont du mal à atteindre leur débit maximal alors que le GM107/204/206 en sont plus proches, une efficacité en hausse des unités de texturing qui est probablement liée au fait que leur proportion réduite permet de plus facilement les saturer.

Les GM204 et GM206 sont capables d'accéder aux surfaces de type D32F aussi efficacement que les autres formats, comme les GPU Radeon, mais contrairement aux GPU GeForce précédents.

Fillrate

Nous avons mesuré le fillrate sans et puis avec blending, et ce avec différents formats de données :

[ Standard ] [ Avec Blending ]

Le fillrate était l'un des points forts du GPU Hawaii qui intègre pas moins de 64 ROP chargés d'écrire les pixels en mémoire, qui plus est d'une efficacité élevée avec blending. Mais avec le GM204, Nvidia est revenu et profite en plus d'une fréquence GPU très élevée. De son côté, le GM206 se comporte comme le GK104.

A noter que les GeForce depuis Kepler sont enfin capables de transférer les formats FP10/11 et RGB9E5 à pleine vitesse vers les ROP, mais le blending de ces formats se fait toujours à demi vitesse, contrairement aux Radeon. Par ailleurs, si tous les GPU sont capables de traiter le FP32 simple canal à pleine vitesse sans blending, seules les Radeon conservent ce débit avec blending.

Page 4 - Performances théoriques : géométrie

Débit de triangles

Étant donné les différences architecturales des GPU récents au niveau du traitement de la géométrie, nous nous sommes évidemment penchés de plus près sur le sujet. Tout d'abord nous avons observé les débits de triangles dans deux cas de figure : quand tous les triangles sont affichés et quand ils sont tous rejetés (parce qu'ils tournent le dos à la caméra) :

Quand les triangles peuvent être éjectés du rendu, ce qui en concerne en pratique toujours une part conséquente, la plupart des GeForce GTX peuvent profiter d'un débit supérieur pour se démarquer des Radeon.

Mais une fois que les triangles doivent être rendus, le débit maximal théorique des GeForce Kepler chute sur certains modèles alors que leur efficacité est plus généralement en baisse, peut-être parce que ces GPU sont engorgés à un endroit ou à un autre, ou encore parce que leurs performances ont été réduites artificiellement pour différencier les Quadro des GeForce. Quoi qu'il en soit, cela ne semble plus être un problème sur Maxwell de seconde génération. Le GM206 en profite pour devancer le GK110 sur ce point.

Ensuite nous avons effectué un test similaire mais en utilisant la tessellation :

Avec les GeForce GTX Kepler, Nvidia réaffirmait sa supériorité lorsqu'il s'agit de traiter un nombre important de petits triangles générés par un niveau de tessellation élevé. Cet avantage ne concerne par contre que le haut de gamme. Le premier GPU Maxwell de première génération n'en profite pas, ses performances se situant quelque peu derrière celles de Bonaire, tout en représentant malgré tout un net gain par rapport au GK107. Le GM204 Maxwell de seconde génération renforce l'avantage de Nvidia lorsque les triangles ne sont pas affichés mais peine à se démarquer du GK110 quand ils doivent être affichés. Quant au GM206 il se place devant le GK104 dans le premier cas, mais derrière dans le second.

Les Radeon HD 7900/ R9 280X ne se démarquent pas des Radeon HD 7800 et de la Radeon HD 7790 qui disposent du même nombre d'unités fixes dédiées à cette tâche.

Pour rappel, l'architecture des Radeon fait qu'elles peuvent être engorgées plus facilement par la quantité de données générées, ce qui réduit drastiquement leur débit dans ce cas. AMD fait évoluer progressivement les différents buffers liés à la tessellation, et la manière de les utiliser, pour éviter autant que possible de se trouver dans ce cas.

Hawaii et Tonga affichent un gain important au niveau du débit brut, soit lorsque les triangles générés ne doivent pas être rendus. Lorsque c'est le cas, ils se contentent par contre dans notre test d'une progression très légère. Notre test étant relativement lourd en termes de données générées par triangles, nous supposons que ces GPU souffrent d'un embouteillage à un endroit ou à un autre, peut-être au niveau du canal de transfert de ces données vers les contrôleurs mémoire (mais pas directement au niveau de la bande passante globale qui est loin d'être saturée).

Page 5 - Spécifications, histoire de BIOS

Spécifications

Rappelons tout d'abord que sur la majorité des cartes graphiques Nvidia depuis la génération Kepler, la fréquence turbo maximale n'est pas spécifiée, elle varie d'un échantillon à l'autre. Grossièrement, Nvidia applique un overclocking automatique sur les GPU qui sont capables de tenir la fréquence officielle à une tension plus faible que le maximum spécifié.

La GeForce GTX 960 embarque un GPU GM206 en configuration complète, cadencé à une fréquence relativement modeste au vu des capacités de ce GPU. La fréquence GPU Boost communiquée (une spécification factice qui correspond au turbo minimum garanti) est relativement plus faible que sur les dérivés du GM204, un choix de Nvidia qui devrait permettre à ses partenaires de proposer plus facilement de gros overclocking d'usine puisqu'ils sont obligés de respecter le ratio entre fréquence de base et GPU Boost.

Au niveau des débits bruts, la GTX 960 se place à mi-chemin entre les GTX 970 et 750 Ti, excepté pour la bande passante mémoire puisqu'elle doit se contenter d'un bus 128-bit comme la seconde, certes avec une mémoire GDDR5 plus hautement cadencée.

Sur le papier, en dehors du fillrate, la Radeon R9 285 semble avoir un net avantage, mais comme nous allons le voir la réalité est différente, notamment parce que le rendement de l'architecture Maxwell est très élevé mais également parce que les 1024 unités de calcul généralistes du GM206 sont accompagnées de 256 unités spécialisées de plus. Celles-ci, qui ne sont pas prises en compte dans les chiffres de puissance de calcul, apportent un soutien non-négligeable.

A noter que le service marketing de Nvidia est parvenu de son côté à calculer une bande passante mémoire "effective" supérieure suite à l'amélioration sur Maxwell des algorithmes de compression. Une manière hasardeuse de tenter de faire oublier le bus 128-bit et les limitations qui peuvent l'accompagner. Mais, heureusement, Nvidia ne va pas jusqu'à parler d'une mémoire vidéo de 16 Go suite au support des derniers formats de compression de DirectX !

Nvidia a fixé une limite de consommation de 120W pour la GTX 960 de référence mais ses partenaires seront libres d'aller au-delà. Pour une GTX 960 sans overclocking d'usine, 120W représente une limite moins restrictive que les 150W d'une GTX 970 par exemple.

Si vous êtes attentifs, vous pourrez remarquer que les PCB de la plupart, voire de la totalité, des GTX 960 est prévu pour accueillir un bus 192-bit. Nvidia nous assure par contre que la GTX 960 embarque bien une version complète du GM206. Ce dernier n'en donc pas capable d'exploiter un bus 192-bit et ces PCB sont de toute évidence prévus pour accueillir un autre GPU, peut-être un modèle de la génération Kepler ou une variante du GM204 qui aurait été préparée par Nvidia sur un packaging similaire à celui du GM206.

Histoire de BIOS

Pour ce test, Nvidia nous a fait parvenir une GeForce GTX 960 Strix d'Asus qui profite d'un overclocking d'usine avec une fréquence GPU de base qui passe de 1126 à 1228 MHz. Jusqu'ici rien d'anormal.

Tout comme MSI, Asus propose dorénavant via son utilitaire GPU Tweak une fonctionnalité d'overclocking automatique appelée "OC Mode", que les utilisateurs peuvent activer manuellement s'ils le désirent. Celle-ci consiste à pousser la fréquence GPU de 26 MHz, soit la fréquence de base à 1253 MHz sur la GTX 960 de la marque. Malheureusement, tout comme le fait de temps en temps MSI, Asus a eu la mauvaise idée de tricher sur les échantillons destinés à la presse en les équipant d'un BIOS spécial qui active par défaut cet overclocking. De quoi grappiller 1 à 2% ni vu ni connu, en profitant des testeurs peu regardants sur les détails.

De manière un petit peu surréaliste, Asus se justifie en expliquant que GPU Tweak offre un "OC Mode pour tous" mais que la plupart des testeurs ne l'utilisent pas. Ils ont donc décidé de pousser les fréquences au niveau de l'OC Mode pour qu'il soit testé directement. Logique…

Il est possible de revenir aux fréquences d'origine via GPU Tweak ou tout autre utilitaire d'overclocking mais pour nous assurer qu'aucune autre modification n'avait été faite dans ce BIOS presse, nous préférions pouvoir remplacer celui-ci par la version du commerce. Version que nous avons pu obtenir rapidement, mais les BIOS des échantillons presse d'Asus sont protégés en écriture. Une protection que nous n'avons pu désactiver qu'en dernière minute, Nvidia n'étant pas prêt à nous fournir une version de l'utilitaire NVflash qui en soit capable. C'est Asus qui nous a finalement fourni son propre utilitaire et nos mesures de performances ont été effectuées avec le BIOS commercial.

Ceci étant dit, avec les moyens à notre disposition, nous n'avions pas noté sur le BIOS "press edition" de différence qui impacte les performances autre que la fréquence (courbe de ventilation, limite de consommation, tensions…).

Page 6 - Asus GeForce GTX 960 Strix

Asus GTX 960 Strix

Pour ce test, Nvidia nous a fait parvenir une GeForce GTX 960 Strix d'Asus. Celle-ci profite d'un overclocking d'usine avec une fréquence GPU de base qui passe de 1126 à 1228 MHz (turbo max réel à 1354 MHz sur notre échantillon) et une fréquence mémoire poussée de 1753 à 1800 MHz. Elle est commercialisée à 249€ avec une garantie de 3 ans.

La GTX 960 Strix est plutôt compacte avec 21.5cm de long, dont une partie est par ailleurs uniquement liée au ventirad qui dépasse à l'arrière du PCB de 17cm. A noter que la carte est par contre 1 cm plus haute que la normale.

Le ventirad de type DirectCU II intègre à sa base 4 caloducs prévus pour un contact direct, qui parcourent un radiateur un aluminium surmonté par 2 ventilateurs de 75mm. Asus a cependant eu la mauvaise idée de ne pas observer de plus près la forme du GM206 :

Comme vous pouvez l'observer, seuls 2 caloducs touchent le GPU et ce uniquement partiellement. Ce bloc de refroidissement est de toute évidence mal optimisé pour le GM206, et certains n'hésiteront pas à ironiser sur l'argument du contact direct cher à la marque… Cela ne veut cependant pas dire qu'il ne permet pas de refroidir suffisamment bien le GM206, ce n'est pas le cas, mais qu'il n'aide pas Asus à proposer une carte silencieuse.

Asus a placé un petit radiateur sur l'étage d'alimentation et une plaque arrière qui ne peut être démontée sans retirer le ventirad, et poser des problèmes éventuels de garantie, puisqu'elle est visée depuis la face avant.

Les ventilateurs de la GTX 960 Strix restent à l'arrêt au repos ou à très faible charge et ne s'activent que quand la température GPU atteint 65 °C. Un mode de fonctionnement déjà aperçu sur la GTX 970 de la marque et que Nvidia incite dorénavant à implémenter.

Asus reprend la connectique de référence, à savoir une sortie DVI, une HDMI et 3 DisplayPort. Un seul connecteur d'alimentation 6 broches est nécessaire, le fabricant s'étant contenté d'une limite de consommation raisonnablement rehaussée de 120 à 130W. Il est possible de la pousser manuellement jusqu'à 150W.

Le PCB en lui-même est très proche de celui de modèles précédents, par exemple les GTX 760 de la marque. L'étage d'alimentation exploite 4 phases pour le GPU et une de plus pour la mémoire GDDR5 Samsung.

Nous avons pu overclocker notre échantillon de 130 MHz pour le GPU, de quoi atteindre une fréquence turbo maximale de 1484 MHz, et de 200 MHz pour sa mémoire GDDR5 qui tourne alors à 2000 MHz.

A noter que notre échantillon de test souffrait d'un petit coil whine avec ou sans overclocking.

Page 7 - Inno3D GeForce GTX 960 iChill Ultra

Inno3D GTX 960 iChill Ultra

De son côté, Inno3D nous a fait parvenir un exemplaire de sa GTX 960 iChill Ultra, la plus musclée des 3 variantes proposées à son catalogue. Celle-ci profite d'un overclocking d'usine conséquent avec une fréquence GPU de base qui passe de 1126 à 1329 MHz (turbo max réel à 1443 MHz sur cet échantillon) et une fréquence mémoire poussée de 1753 à 1800 MHz.

Proposée à 239€, la carte est garantie 2 ans et livrée avec un tapis de souris et une licence pour 3DMark Advanced.

La GTX 960 iChill Ultra embarque un ventirad HerculeZ pour le moins massif. Il représente probablement ce qui se fera de plus gros en GTX 960 : 30cm de long et triple slot.

Nous retrouvons 4 caloducs pris en sandwich entre une base en aluminium et un radiateur principal. Deux de ces caloducs rejoignent un radiateur secondaire. Attention vous pourriez avoir l'impression qu'un cinquième caloduc est présent, mais il s'agit d'une simple baguette d'aluminium utilisée pour maintenir les 2 radiateurs.

Un petit radiateur est placé sur l'étage d'alimentation ainsi qu'une plaque autour du GPU et sur la face arrière. Cette plaque arrière dépasse cependant un petit peu trop, 4mm contre 3mm en général. Tout juste de quoi empêcher l'installation de la carte sur certaines cartes-mères qui exploitent le premier slot PCI Express. Nous avons d'ailleurs endommagé un slot DIMM sur notre système de test on n'y prenant pas garde.

Nous avons remonté le problème au fabricant qui nous a indiqué qu'il allait rapidement vérifier ce point et si nécessaire adapter sa plaque arrière. Un problème qui peut être embêtant car ici aussi il est impossible de démonter cette plaque sans retirer le ventirad puisqu'elle est fixée depuis la face avant.

Le refroidissement est assuré par 3 ventilateurs de 90mm qui restent à l'arrêt tant que le GPU ne dépasse pas 60 °C ou que la consommation n'atteint pas 60W.

Inno3D reprend également la connectique de référence mais passe par contre à 2 connecteurs d'alimentation 6 broches, sans cependant en profiter pour répartir de manière optimale les sources de courant. L'alimentation via le bus est ainsi trop sollicitée. Alors que la limite de consommation de la carte a été poussée à 180W par défaut par le fabricant, pour assurer une fréquence maximale même avec très gros OC et jeux très lourds, il sera difficile de dépasser 140-150W.

Suivant le type de charge, c'est en effet plus ou moins à ce niveau de consommation que la limite secondaire de 66W (12V) du bus PCI Express est atteinte, GPU Boost réduit alors la fréquence GPU pour éviter que vous n'endommagiez votre carte-mère. En pratique ce n'est pas réellement un problème, la consommation dans la majorité des jeux restant inférieure, même avec overclocking, mais il est dommage d'avoir prévu des capacités en pratique inexploitables. De son côté Inno3D indique ne pas mettre publiquement en avant cette limite de consommation de 180W mais plutôt la valeur de 160W.

Pour l'overclocking il est possible d'augmenter la limite globale de 180W à 200W, ce qui a pour effet de pousser celle du PCI Express de 66W à 75W, ce qui permet de débloquer un peu plus de marge de manœuvre si nécessaire. La plupart des cartes-mères accepteront cela sans broncher.

Le long PCB présente assez bien d'espace vide, Inno3D n'ayant pas cherché à le condenser. Il exploite 4 phases pour alimenter le GPU et une de plus pour le mémoire GDDR5 Samung.

Nous avons pu overclocker notre échantillon de 52 MHz pour le GPU, de quoi atteindre une fréquence turbo maximale de 1494 MHz, et de 200 MHz pour sa mémoire GDDR5 qui tourne alors à 2000 MHz.

A noter que notre échantillon de test souffrait d'un coil whine important avec ou sans overclocking. Inno3D nous a indiqué avoir également constaté le problème sur les premiers lots produits, dont sont issus les cartes de test, et avoir modifié certains composants pour le limiter autant que possible.

Page 8 - MSI GeForce GTX 960 Gaming

MSI GTX 960 Gaming

Nous avons également reçu le jour du lancement un exemplaire de la GTX 960 Gaming de MSI, la plus musclée des 3 variantes proposées par le fabricant. Celle-ci profite d'un petit overclocking d'usine avec une fréquence GPU de base qui passe de 1126 à 1190 MHz. Le turbo max réel est à 1354 MHz sur cet échantillon, ce qui représente un écart un peu plus élevé que sur les 2 autres cartes que nous avons testées. Il s'agit donc d'un très bon échantillon.

Proposée à 239€, la carte est garantie 2 ans.

La GTX 960 Gaming embarque un ventirad Twin Frozr V proche de celui de la GTX 970 Gaming. Il en reprend le format ce qui porte la longueur de la carte à 27cm et ce avec une hauteur 3cm plus importante que la normale. Il ne s'agit donc pas d'un modèle compact.

Nous retrouvons 3 caloducs (contre 4 pour la GTX 970 Gaming) pris en sandwich entre une base en aluminium et un large radiateur. Deux de ces caloducs sont de type 6mm et plutôt long, de manière à parcourir le radiateur de part et d'autre du GPU, alors que le troisième est de type 8mm et va rejoindre l'extrémité du radiateur.

Un petit radiateur est placé sur l'étage d'alimentation et une barra de renfort sur le dessus du PCB. MSI a par contre fait l'impasse sur la plaque arrière, qui n'est pas réellement utile sur ce type de carte et peut compliquer la mise en place d'un système SLI.

Le refroidissement est assuré par 2 ventilateurs de 100mm qui restent à l'arrêt tant que le GPU ne dépasse pas 64 °C.

MSI reprend également la connectique de référence mais passe par contre d'un connecteur d'alimentation 6 broches à un modèle 8 broches, plus pratique que 2x 6 broches. La limite de consommation a été revue à la hausse et passe par défaut de 120 à 150W avec possibilité de la monter manuellement à 162W via les utilitaires d'overclockings.

Sans que nous ne sachions si cela est spécifique à notre échantillon ou lié au design de MSI pour ce modèle, il semblerait que les circuits de mesure de la consommation surévaluent cette dernière d'environ 10%. En pratique la limite de consommation sur notre échantillon était ainsi par défaut plutôt de 135W. C'était par contre suffisant pour maintenir la fréquence turbo maximale même dans les jeux les plus lourds de notre protocole.

Le long PCB présente une grosse zone d'espace vide et il semble évident que sa taille est uniquement liée à celle du ventirad. Il exploite 4 phases pour alimenter le GPU et une de plus pour le mémoire GDDR5 Samsung.

Nous avons pu overclocker notre échantillon de 156 MHz pour le GPU, de quoi atteindre une fréquence turbo maximale de 1510 MHz, et de 200 MHz pour sa mémoire GDDR5 qui tourne alors à 1950 MHz.

A noter que notre échantillon de test souffrait d'un petit coil whine, avec ou sans overclocking.

La GTX 960 de MSI étant particulièrement silencieuse, avec des ventilateurs qui tournent à faible vitesse, nous avons voulu vérifier à l'aide de la thermographique infrarouge si son étage d'alimentation n'avait pas tendance à trop s'échauffer :

Nous avons noté 95 °C au niveau des VRM après une période d'une heure de charge lourde (qui correspond à +/- 128W en moyenne sur cette carte qui atteint sa limite de consommation). C'est élevé mais il s'agit d'une température pour laquelle ces composants sont prévus. Ce n'est donc pas réellement un problème, mais il sera par contre préférable de s'assurer que le boîtier soit bien ventilé si vous comptez overclocker cette carte graphique en poussant sa limite de consommation. Idéalement, une cinquième phase pour alimenter le GPU aurait permis à MSI d'améliorer ce point.

Page 9 - Consommation, efficacité énergétique

Consommation

Nous avons utilisé le protocole de test qui nous permet de mesurer la consommation de la carte graphique seule. Nous avons effectué ces mesures au repos sur le bureau Windows 7 et en veille écran..

Pour la charge, nous testons d'une part Anno 2070 en mode de qualité maximale qui représente un jeu très lourd et d'autre part Battlefield 4 en mode Ultra qui représente un jeu moins lourd.

La consommation en charge est comme prévu très bien contenue pour les GTX 960. Aux spécifications de référence, la limite de 120W est atteinte dans Anno et la fréquence GPU est alors légèrement réduite. De son côté l'Asus frôle sa limite de 130, mais reste à sa fréquence maximale, alors que l'Inno3D n'est pas inquiétée par sa limite de consommation.

Dans un jeu moins gourmand tel que Battlefield 4, la consommation reste sous les 100W pour les 3 cartes. Les Radeon sont larguées sur ce point.

Bien que ces données soient approximatives, compte tenu de la variation entre échantillons d'un même modèle, nous avons mis en relation ces mesures de consommation avec les performances, en retenant des fps par 100W pour que les données soient plus lisibles, de quoi donner une idée globale sur le rendement énergétique de toutes ces cartes :

[ Battlefield 4 ] [ Anno 2070 ]

L'efficacité énergétique des GeForce GTX 900 fait un bond en avant, et les GTX 960 ne dérogent pas à la règle. Dans Battlefield 4, elles sont 2x plus efficaces que les Radeon R9 285/280X !

Page 10 - Températures et nuisances sonores

Nuisances sonores

Nous plaçons les cartes dans un boîtier Cooler Master RC-690 II Advanced et mesurons le bruit d'une part au repos et d'autre part en charge sous le test1 de 3DMark11. Un SSD est utilisé et tous les ventilateurs du boîtier ainsi que celui du CPU sont coupés pour la mesure. Le sonomètre est placé à 60cm du boîtier fermé et le niveau de bruit ambiant se situe à moins de 20 dBA, ce qui est la limite de sensibilité pour laquelle il est certifié et calibré.

Pour comparaison, nous avons intégré sur cette page les résultats des GTX 970 d'Asus et d'Inno3D.

Au repos, les 2 GTX 960 sont totalement silencieuses puisque leurs ventilateurs sont à l'arrêt. A 19.8 dBA, nous sommes à la limite de sensibilité de notre sonomètre. En charge, la GTX 960 d'Asus est loin d'être discrète, malgré la faible consommation de son GPU, ce qui est dommage. La carte d'Inno3D s'en tire bien mieux grâce à son imposant ventirad. Malgré la charge lourde, ses ventilateurs se contentent de tourner à la vitesse minimale à laquelle ils s'enclenchent.

C'est cependant MSI qui s'en tire le mieux grâce à un ventirad efficace mais également grâce à une courbe de ventilation finement calibrée avec une accélération très progressive même à faible vitesse.

A noter cependant que du coil whine se fait entendre sur ces 3 GTX 960, le niveau le plus élevé étant sur l'Inno3D. Ce coil whine n'a par contre presque aucune incidence sur la pression sonore mesurée. Même sur la MSI Gaming, le coil whine ne fait monter la pression sonore que de 22.4 à 22.7 dBA. La fréquence du coil whine fait par contre qu'il est très perceptible, suivant la position de l'utilisateur puisqu'il est aussi plutôt directionnel.

Températures

Toujours placées dans le même boîtier, nous avons relevé la température du GPU rapportée par la sonde interne :

Les GTX 960 sont bien refroidies, avec un petit avantage à la carte d'Inno3D. A noter que la température relativement élevée au repos pour les GTX 970/960 Asus, les GTX 970/960 MSI et la GTX 960 Inno3D est liée au fait que leurs ventilateurs sont à l'arrêt.

Page 11 - Protocole de test

Protocole de test

Pour ce test, nous avons repris notre protocole de 10 jeux utilisé précédemment, mais en remplaçant Far Cry 3 par Far Cry 4. Tous les derniers patchs au 19/01/2015 ont été installés, la plupart des jeux étant maintenus à jour via Steam/Origin/Uplay.

Nous avons opté pour la résolution la plus courante du 1080p avec un niveau de détail élevé à très élevé suivant les jeux, de manière à obtenir à peu près 60 fps sur la GeForce GTX 960.

Pour rappel, nous n'affichons plus les décimales dans les résultats de performances dans les jeux pour rendre les graphiques plus lisibles. Ces décimales sont néanmoins bien notées et prises en compte pour le calcul de l'indice.

Toutes les cartes ont été testées avec les pilotes Catalyst 14.12 WHQL (14.501.1003) et GeForce 347.25 WHQL. Nous avons forcé l'activation du PCI Express 3.0 sur la plateforme X79 pour les GeForce.

Nous avons simulé une GeForce GTX 960 aux spécifications de référence à travers la GTX 960 d'Inno3D équipée pour l'occasion d'un BIOS modifié à cet effet. Pour cela nous avons ramené sa limite de consommation à 120W et corrigé les fréquences. Les cartes partenaires ont été testées telles quelles, c'est-à-dire en profitant de toute la marge de ces exemplaires particuliers au niveau de leur fréquence turbo.

Configuration de test

Intel Core i7 3960X (HT off, Turbo 1/2/3/4/6 cores: 4 GHz)
Asus P9X79 WS
8 Go DDR3 2133 Corsair
Windows 7 64 bits
Pilotes GeForce 347.25 WHQL
Catalyst 14.12 WHQL (14.501.1003)

Page 12 - Benchmark : 3DMark et Unigine

Pour ce test, nous avons lancé différents benchmarks populaires :

3DMark Fire Strike

Nous lançons le test Fire Strike avec les 2 presets proposés par Futuremark :

[ Fire Strike ] [ Fire Strike Extreme ]

Unigine Valley 1.0 & Heaven 4.0

Les tests sont effectués avec tous les paramètres au maximum en 1920*1080 et MSAA 8x.

[ Valley ] [ Heaven ]

Page 13 - Benchmark : Anno 2070

Anno 2070

Anno 2070 reprend une évolution du moteur d'Anno 1404 qui intègre un support de DirectX 11.

Nous utilisons le mode de qualité maximale du jeu et effectuons un déplacement sur une carte en mesurant les performances avec Fraps.

Dans Anno 2070, c'est avant tout la puissance de calcul qui compte et les GPU sont mis à rude épreuve par rapport à leurs limites de consommation ou de température. De quoi permettre aux GTX 900 de se démarquer.

Page 14 - Benchmark : Batman Arkham Origins

Batman Arkham Origins

Dernier opus de la série, Batman Arkham Origins est toujours basé sur l'Unreal Engine 3 mais pousse un petit peu plus loin les effets graphiques dont certains ont été implémentés sur PC en collaboration avec Nvidia. C'est le cas du TXAA et d'effets GPU PhysX réservés aux GeForce (il n'est plus possible d'activer une version CPU de tous ces effets), mais également de l'occlusion ambiante de type HBAO+, d'un effet de Depth of Field plus évolué (NVDOF), d'ombres adoucies (PCSS) et de la tessellation (pour la cape et la neige) qui sont utilisables sur tous les GPU DirectX 11.

Nous utilisons le mode de qualité maximale du jeu, avec du MSAA 4x. Nous relevons les performances avec Fraps, sur un parcours bien défini. Le jeu est maintenu à jour via Steam.

Batman Arkham Origins est bien plus dépendant de la bande passante mémoire ce qui en fait un des jeux les plus difficiles pour les GTX 900. La GTX 960 termine ici derrière la Radeon R9 285 et la GTX 760. Il lui faut un overclocking massif, tel que celui de l'Inno3D pour revenir à leur niveau.

Page 15 - Benchmark : Battlefield 4

Battlefield 4

Battlefield 4 repose sur le moteur Frostbite 3, une évolution de la version 2 présente dans Battlefield 3. La base du rendu reste très proche (rendu différé, calcul de l'éclairage via compute shaders) et les évolutions visibles sont mineures, DICE ayant principalement optimisé son moteur pour les consoles de nouvelle génération. Parmi les petites nouveautés, citons un support plus avancé de la tessellation et une amélioration du module "destruction" du moteur.

Sur PC, un mode Mantle spécifique aux Radeon et qui permet de réduire le coût CPU du rendu est proposé mais nous ne l'avons pas utilisé pour ce test. Pour rappel, il s'agit d'une API propriétaire de plus bas niveau dédiée aux Radeon HD 7000 et supérieures, qui a été développée par AMD et DICE.

Nous testons le mode Ultra soit avec MSAA 4x ainsi que ce même mode en désactivant le MSAA. Nous relevons les performances avec Fraps, sur un parcours bien défini. Le jeu est maintenu à jour via Origin.

[ Avec MSAA 4x ] [ Sans MSAA ]

Les GeForce GTX 900 apprécient particulièrement ce jeu et les GTX 960 ne dérogent pas à la règle même si leur avantage se réduit quelque peu avec MSAA 4x.

Page 16 - Benchmark : Crysis 3

Crysis 3

Crysis 3 reprend le même moteur que Crysis 2 : le CryEngine 3. Ce dernier profite cependant de quelques petites évolutions telles qu'un support plus avancé de l'antialiasing : FXAA, MSAA et TXAA sont au programme, tout comme un nouveau mode appelé SMAA.

Ce dernier est une évolution du MLAA qui permet, optionnellement, de prendre en compte des données de type sous-pixels soit à travers la combinaison avec du MSAA 2x, soit avec une composante temporelle calculée à partir de l'image précédente. Le SMAA 1x est la simple évolution du MLAA, le SMAA 2tx utilise une composante temporelle et le SMAA 4x y ajoute le MSAA 2x. Notez qu'il ne faut pas confondre le SMAA 2tx proposé en mono-GPU avec le SMAA 2x proposé en multi-GPU, ce dernier utilisant du MSAA 2x sans composante temporelle.

Nous mesurons les performances avec Fraps et le jeu est maintenu à jour via Origin.

La GTX 960 se place ici au niveau de la GTX 760 et de la Radeon R9 285.

Page 17 - Benchmark : Far Cry 4

Far Cry 4

Dernier opus de la série, il est basé sur une petite évolution du Dunia Engine 2 qui avait été introduit avec Far Cry 3. Ses caractéristiques sont donc similaires et parmi les petites évolutions nous notons l'ajout par les développeurs du support de l'antialiasing SMAA 1x en plus du MSAA qui est très, voire trop, gourmand avec ce moteur.

Nous activons le niveau de qualité High, qui inclus le SMAA 1x et utilisons Fraps sur un parcours bien défini.

Les GeForce Kepler sont ici en retrait, probablement parce qu'il s'agit d'un jeu récent et que Nvidia a quelque peu réduit son effort d'optimisation pour son ancienne architecture.

Page 18 - Benchmark : GRID 2

GRID 2

Dernier né chez Codemaster, GRID 2 reprend une évolution légère du moteur DirectX 11 maison exploité par DiRT Showdown. Pour rappel, en partenariat avec AMD, les développeurs avaient mis en place un éclairage avancé qui prend en compte de nombreuses sources de lumière directes et indirectes ainsi qu'une approximation du rendu de type illumination globale. Ces techniques sont toujours exploitées, même si le partenaire principal de Codemaster est cette fois Intel qui a aidé à la mise en place d'optimisations spécifiques aux GPU intégrés à Haswell.

Pour mesurer les performances, nous poussons toutes les options graphiques à leur maximum, y compris l'adoucissement de l'effet d'occlusion ambiante, et activons le MSAA 8x. Nous utilisons Fraps sur l'environnement de Barcelone, le plus lourd dans le jeu.

Les Radeon sont ici légèrement en retrait, ce qui permet à la GTX 960 d'égaler la R9 285 alors que le niveau élevé de MSAA aurait pu nous laisser penser à un résultat différent.

Page 19 - Benchmark : Hitman Absolution

Hitman Absolution

Hitman Absolution utilise un moteur plutôt lourd et qui manque probablement d'optimisations. La charge CPU est par ailleurs relativement élevée dans certaines scènes dans lesquelles une foule importante peut être animée. Différents effets DirectX 11 ont été intégrés avec la coopération d'AMD.

Pour mesurer les performances, nous poussons les options graphiques au niveau ultra et utilisons fraps dans le jeu.

Hitman Absolution est le jeu testé dans lequel les GeForce GTX 900 souffrent le plus. La GTX 960 tombe alors au niveau de la GTX 660, loin derrière la Radeon R9 285. L'utilisation du MFAA sera ici bienvenue.

Page 20 - Benchmark : Metro Last Light

Metro Last Light

Tout comme Metro 2033, sa suite Last Light développée par 4A Games est très gourmande. Elle repose sur une petite évolution du moteur DirectX 11 maison, le 4A Engine, ainsi que sur des environnements et éclairages plus riches. Le jeu pousse par ailleurs plus loin l'utilisation de la tessellation, mise en place en collaboration avec Nvidia, autant sur les personnages que sur les objets ou les sols, même si dans bien des cas la différence n'est cependant pas transcendante.

Au niveau de l'antialiasing, le 4A Engine support l'AAA, un algorithme maison similaire au FXAA/MLAA/SMAA, ainsi que le SSAA extrêmement gourmand en mode 2x, 3x et 4x. Un mode 0.5x est également proposé et consiste alors à rendre le jeu dans une résolution inférieur qui est par la suite étendue.

Le support de GPU PhysX est toujours de la partie. A ne pas confondre avec PhysX, qui gère globalement la physique au niveau du CPU, il s'agit d'effets accélérés par le GPU à travers une librairie propriétaire de Nvidia, ce qui implique qu'ils ne peuvent pas être accélérés sur une Radeon. Ils sont alors traités par le CPU, d'une manière non-optimisée, ce qui rend leur utilisation difficile en pratique.

Nous avons testé le jeu via Fraps sur un parcours bien défini. Nous avons dû faire l'impasse sur le SSAA, bien trop gourmand et nous contenter du mode de qualité élevée mais en poussant le niveau de tessellation sur très élevé.

Un jeu sans MSAA que les GTX 900 apprécient particulièrement.

Page 21 - Benchmark : Splinter Cell Blacklist

Splinter Cell Blacklist

Basé sur le LEAD engine, une version retravaillée en interne de l'Unreal Engine 2.5, Splinter Cell Blacklist profite pour la version PC d'effets graphiques supplémentaires mis en place en collaboration avec Nvidia tels que le HBAO+, la tessellation ou encore le TXAA.

Notez au niveau de l'occlusion ambiante que le jeu propose de nombreuses options dont les plus avancées représentent l'effet le plus lourd du jeu.

Nous mesurons les performances avec Fraps sur un parcours bien défini et le jeu est maintenu à jour via Uplay.

Dans Splinter Cell, les GTX 900 gardent la tête, mais de peu pour la GTX 960.

Page 22 - Benchmark : Tomb Raider

Tomb Raider

Tomb Raider a été l'une des meilleures surprises de 2013. Le rendu graphique est plutôt réussi, AMD ayant collaboré avec les développeurs pour s'assurer d'une version PC de bon niveau. C'est particulièrement le cas pour TressFX, l'option de rendu avancé des cheveux de Lara qui apporte une bonne dose de réalisme.

Nous avons testé Tomb Raider en mode de qualité Ultime qui inclut l'effet TressFX. Nous avons mesuré les performances avec Fraps, sans utiliser le bench intégré qui correspond plus aux cinématiques qu'aux scènes de jeu classiques.

La GTX 960 égale dans ce dernier jeu les Radeon R9 285 et 280 et affiche une avance de 20% sur la GTX 760.

Page 23 - Récapitulatif des performances

Récapitulatif

Bien que les résultats de chaque jeu aient tous un intérêt, nous avons calculé un indice de performances en nous basant sur l'ensemble de résultats et en attachant une importance particulière à donner le même poids à chacun des jeux. Les benchmarks de Futuremark et d'Unigine ne sont pas pris en compte et le poids de chacun des tests effectué pour Battlefield 4 est réduit de moitié de façon à ce que ce jeu n'ait pas une influence plus importante que les autres sur l'indice.

Nous avons attribué un indice de 100 à la GeForce GTX 760 de référence :

Au final, la GeForce GTX 960 de référence se contente d'une petite avance de 8% sur sa la GTX 760 qu'elle remplace, ce qui lui permet d'égaler en moyenne la Radeon R9 285, mais avec des résultats variables suivant l'influence ou non du MSAA sur les performances.

Un modèle de GTX 960 fortement overclocké d'usine tel que l'iChill Ultra d'Inno3D est capable de rivaliser avec une GTX 770 de référence, mais là aussi avec pas mal de variabilité d'un jeu à l'autre.

Si mettre à jour un système équipé d'une GTX 760 avec une GTX 960 n'aura pas réellement de sens, l'intérêt est bien entendu plus évident pour des modèles plus anciens. Nous avons ainsi observé 36% de mieux par rapport à une GTX 660 et 140% de mieux par rapport à une GTX 460 qui commence à sérieusement souffrir dans de nombreux jeux.

Parmi les cartes plus haut de gamme, la Radeon R9 290 de Sapphire est 50% plus performante et la GTX 970 pousse cela jusqu'à 55%.

Page 24 - GM206, GTX 960 et overclocking

Overclocking et GM206

Avant d'observer les capacités d'overclocking directes des 3 GTX 960 customs que nous avons testées, nous avons voulu nous pencher de plus près sur l'influence de l'overclocking du GPU et de la mémoire sur les performances du GPU GM206. Est-il plutôt limité par sa puissance de calcul ou par sa bande passante mémoire ? Pour cela nous sommes partis de fréquences de 1300 MHz pour le GPU et de 1750 MHz pour la mémoire, ce qui correspond à peu près aux fréquences turbos d'un modèle custom. Nous avons ensuite poussé ces valeurs dans chaque cas de 14%, soit 1485 MHz et 2000 MHz :

[ % ] [ FPS ]

Dans le cas d'Anno 2070 par exemple, seule la fréquence GPU compte, les gains liés à l'overclocking de la mémoire étant minimes.

Par contre, Battlefield 4 affiche des gains similaires avec l'overclocking du GPU ou de la mémoire - l'un ou l'autre légèrement plus important suivant l'utilisation ou non du MSAA - et un gain combiné qui profite clairement des deux. Pour ce jeux, il faut en conclure que sur GM206, à peu près la moitié du temps de rendu d'une image est limité par la puissance de calcul alors que l'autre moitié est plutôt limitée par la bande passante mémoire.

Le comportement dans ces deux jeux est identique ou presque à celui que nous avions observé avec le GM204 et la GTX 980.

Nous avons ajouté ici un troisième jeu, Hitman Absolution. Lors des sessions de benchmarks, il nous a laissé penser qu'il était fortement limité par la bande passante mémoire, ce que ces résultats confirment. Il est donc évident que dans le cas de la GTX 960, il est important d'overclocker autant la mémoire que le GPU.

A noter que dans plusieurs cas, nous avons obtenus des performances légèrement supérieures au gain théorique maximum lorsque le GPU et la mémoire étaient tous les deux overclockés. Des résultats reproductibles. Nous ne savons pas exactement d'où vient ce phénomène. Il est possible que certains couples de fréquences permettent une efficacité légèrement supérieure du sous-système mémoire, dont certains éléments sont d'ailleurs cadencés à une fréquence propre, non-communiquée et dont nous ne savons pas comment elle évolue (ou pas) avec l'overclocking.

Overclocking des GTX 960

Comme toutes les cartes graphiques, les GeForce GTX 960 peuvent être overclockées. Elles reprennent pour cela les mêmes interfaces que pour les GeForce GTX 700. Il est donc possible de modifier manuellement :

- la fréquence GPU
- la fréquence mémoire
- la tension GPU maximale
- la limite de température
- la limite de consommation

Les partenaires de Nvidia sont libres de proposer eux aussi des modèles overclockés d'usine, il n'y a que la limite de température par défaut de 80 °C à laquelle ils ne peuvent pas toucher. Ils peuvent par ailleurs décider d'étendre les plages de modifications pour l'overclocking et pour la limite de consommation. La plage de température n'est par contre pas modifiable et le maximum a été fixé par Nvidia à 91 °C.

Nvidia nous a par ailleurs indiqué qu'ils devaient conserver un même ratio entre les fréquences de base et GPU Boost sur lesquelles ils communiquent. Ainsi, un fabricant ne peut pas se contenter de sélectionner les exemplaires qui montent le plus haut en fréquence, ne rien changer et annoncer une fréquence GPU Boost énorme sans toucher à la fréquence de base. Par contre, rien ne les empêche de faire l'inverse, c'est-à-dire sélectionner les échantillons dont la fréquence turbo réelle est la plus faible pour proposer un très gros overclocking d'usine officiel, sans atteindre la limite d'instabilité au niveau de la fréquence maximale réelle.

La limite de température fixée à un niveau relativement bas par défaut, 80 °C, est un élément qui peut être relevé pour gagner quelques points de performances, principalement sur les cartes les moins chères dont le ventirad serait peu efficace. En contrepartie cela augmente la vitesse de ventilation et donc les nuisances sonores. A noter que si la limite est poussée à 91 °C, une fois celle-ci atteinte, le ou les ventilateurs montent instantanément à 100% et reviennent à un niveau normal dès que la température GPU a chuté de quelques degrés. Mieux vaut donc en pratique éviter d'atteindre cette limite et se contenter de 85 °C voire 90 °C au maximum.

Augmenter la limite de consommation est également utile dans le cas où la limite de température n'est pas atteinte (sinon cela ne fait aucune différence). L'intérêt dépend également du niveau de base spécifié par le fabricant. Par exemple sur une GTX 960 de référence dont le TDP est fixé à 120W, l'augmenter a plus de sens que sur une GTX 960 Turbo Ultra dont le TDP par défaut est déjà fixé à 200W, valeur largement supérieure à la consommation observée dans les jeux les plus gourmands.

La fonction d'overvoltage (OV) ou d'augmentation de la tension GPU reste similaire à ce que nous avons pu observer sur les GTX 700 si ce n'est que la plage semble être un peu plus élevée. Il ne s'agit pas d'une augmentation directe de la tension ni d'un offset comme sur les Radeon mais bien d'un allongement de la courbe des tensions/fréquences. Par défaut, la courbe ne peut aller au-delà de 1.212V et l'OV la prolonge légèrement pour gagner 13 ou 26 MHz quand les limites de consommation et de température ne sont pas atteintes. Lorsqu'elles le sont l'OV n'a aucun impact. Voici l'impact de l'OV sur nos 3 cartes :

Asus GTX 960 Strix : max 1354 MHz @ 1.212V et OV max 1.212V -> -----
Inno3D GTX 960 iChill Ultra : max 1443 MHz @ 1.212V et OV max 1.256V -> max 1468 MHz @ 1.256V
MSI GTX 960 Gaming : max 1354 MHz @ 1.200V et OV max 1.256V -> max 1380 MHz @ 1.243V

A noter que l'algorithme GPU Boost bloque l'accès au dernier ou aux deux derniers points de la courbe de tensions/fréquences lorsque certaines conditions sont rencontrées. Nous n'avons pas encore pu les déterminer précisément mais elles semblent liées à la charge et à la température GPU, même quand les limites à ce niveau ne sont pas atteintes. C'était ainsi le cas pour la carte d'Asus dont le pallier à 1.212V n'était pas toujours exploitable. Un mécanisme probablement mis en place par Nvidia pour contenir l'augmentation des nuisances avec un impact négligeable sur les performances.

Augmenter la fréquence GPU sur GTX 900, tout comme sur les GTX 600 et 700, revient à appliquer un offset. C'est-à-dire que la fréquence est relevée sur tous les points de la courbe utilisée par GPU Boost. Vu sous un autre angle, cet offset revient à réduire la tension GPU appliquée à chaque niveau de fréquence. Ainsi, même si votre carte se retrouve limitée par sa température ou sa consommation et n'atteint pas sa fréquence maximale, l'overclocking GPU reste utile ! A noter que nous testons la stabilité d'un overclocking à différents niveaux de charge de manière à vérifier cette stabilité à différents points de la courbe des fréquences/tensions.

Pour l'overclocking des GTX 960, nous n'avons pas activé l'OV. Voici les overclockings GPU que nous avons pu obtenir, en évoluant par pas de 26 MHz pour nous adapter aux étapes de 13 MHz de la courbe de fréquences mise en place par Nvidia :

Asus GTX 960 Strix : +130 MHz -> max 1484 MHz @ 1.212V
Inno3D GTX 960 iChill Ultra : +52 MHz -> max 1494 MHz @ 1.212V
MSI GTX 960 Gaming : +156 MHz -> max 1510 MHz @ 1.200V

Atteindre 1.5 GHz est donc relativement aisé pour le GPU GM206, même si toutes les cartes n'y arriveront pas de manière totalement stable sans overvolting.

Au niveau de la mémoire, nous avons également cherché l'overclocking maximum en évoluant par pas de 50 MHz en fréquence réelle soit par pas de 100 MHz au niveau de la fréquence affichée par Afterburner :

Asus GTX 960 Strix : +"400" MHz -> 2000 MHz
Inno3D GTX 960 iChill Ultra : +"400" MHz -> 2000 MHz
MSI GTX 960 Gaming : +"400" MHz -> 1950 MHz

A noter que sur ces trois cartes, la mémoire est en général stable à 50 MHz de plus, excepté dans les situations où elle est mise à rude épreuve, par exemple dans Hitman Absolution.

Voici les gains de performances que nous avons pu observer en appliquant l'overclocking et en poussant alors les limites de consommation / température à leur maximum. Au niveau des températures, bien que la limite soit poussée à 91 °C pour donner un maximum de marge, en pratique les 3 cartes testées restent largement sous les 80 °C et même sous les 70 °C pour les cartes MSI et Inno3D. Nous avons également limité les 3 cartes à leur fréquence GPU Boost officielle.

[ FPS ] [ % ]

Nous pouvons tout d'abord observer que le turbo variable apport un gain de 1 à 6% par rapport aux spécifications officielles. Il est logiquement plus élevé sur la MSI, très bien dotée à ce niveau.

Les overclocking manuels permettent de gagner de 6 à 14% de mieux. Le gain le plus faible se retrouve sur la carte d'Inno3D dans Anno, ce qui est logique puisque sa fréquence GPU est de base déjà très élevée. A l'inverse c'est la carte de MSI qui profite des plus gros overclockings et donc des plus gros gains. Rappelons cependant, si cela était nécessaire, que l'overclocking est une loterie.

Quel impact sur la consommation ?

Nous avons mesuré la consommation sous Anno 2070 et Battlefield 4 avant et après overclocking en adaptant également les spécifications de la carte d'Inno3D pour la limiter aux spécifications de référence :

[ Watts ] [ Pourcents ]

Sans jouer avec l'overvolting, la consommation ne progresse que très peu après overclocking : de 4 à 12% de plus. Des chiffres similaires à l'augmentation des performances.

Page 25 - Conclusion

Conclusion

Sans révolutionner le segment milieu de gamme en termes de performances, cette époque semble malheureusement révolue, Nvidia remet au goût du jour son offre avec une GeForce GTX 960 plutôt bien positionnée face à la concurrence. Elle n'affiche que 8% de mieux que la GTX 760 qu'elle remplace, mais pour 200€, en premier prix, elle égale en moyenne une Radeon R9 285 qui peine à être intéressante avec un tarif de 230€ et une consommation élevée.

Certes, les ventes décevantes des anciennes Radeon R9 280 font que de nombreux modèles se retrouvent toujours sur le marché, avec des performances légèrement supérieures et un tarif de 190€ pour les moins chères d'entre elles. Mais il s'agit d'une ancienne génération (renommage des Radeon HD 7950 de janvier 2012!) qui ne dispose pas de toutes les fonctionnalités des GPU AMD récents et qui affiche une consommation élevée. 10€ de moins et 3% de plus sont insuffisants pour lutter face à la GeForce GTX 960.

Quant aux Radeon R9 280X, elles aussi anciennes, elles se trouvent au tarif des GTX 960 overclockées dont les performances sont très proches. C'est le cas du modèle Inno3D, 12% plus performant que la carte de référence grâce à une fréquence GPU largement revue à la hausse. Et malgré cet overclocking, là aussi le rendement énergétique reste largement à l'avantage du camp Nvidia.

Le point faible des GeForce GTX 960 est à chercher dans leur bus mémoire de 128-bit qui limite les performances dans certains jeux lorsque l'antialiasing de type MSAA est activé. Leurs résultats restent honorables grâce à l'utilisation d'une mémoire très rapide et de techniques de compression évoluées, mais il n'y a pas de miracle, cela ne permet pas de lutter à armes égales sur ce point avec les GPU interfacés en 256-bit. Nvidia ne l'ignore pas et a intégré un nouveau type d'antialiasing dans ses pilotes, le MFAA qui permet de compenser plutôt bien le déficit de performances dans ces situations. Pour les joueurs pour lesquels les types d'antialiasing ressemblent à des incantations Voodoo, le tout sera géré automatiquement à travers le logiciel GeForce Experience. AMD aimerait pouvoir s'attaquer à la nouvelle venue sous l'angle de ce bus mémoire 128-bit et des performances brutes en MSAA, mais il est difficile de retenir cet argument quand une solution existe et que la solution Nvidia a d'autres avantages.

Si vous avez un budget de l'ordre de 200 à 240 €, il ne nous faut donc au final pas hésiter longtemps pour voir en cette GeForce GTX 960 la carte graphique à vous conseiller pour le jeu vidéo. Elle vous permettra de jouer confortablement en 1080p, à condition de ne pas chercher à pousser toutes les options au maximum dans les jeux les plus gourmands. En plus de son efficacité énergétique élevée, qui permet de réduire les nuisances, elle offre un support complet de Direct3D 12 qui pourra être utile à l'avenir.

Cela ne nous empêche pas de regretter que Nvidia ne profite pas du lancement de son nouveau GPU pour bousculer le milieu de gamme. Le GM206 profite de l'efficacité de l'architecture Maxwell pour offrir un très bon niveau de performances pour une puce de cette taille associée à un bus 128 bits, le tout dans une enveloppe thermique réduite, ce qui n'est pas sans impact sur le coût de production : il existe donc une marge de manœuvre côté prix. Le gain de performances face à la GeForce GTX 760 étant relativement faible, la GTX 960 aurait méritée d'être positionnée à un tarif plus agressif, de l'ordre de 10% inférieur, ce qui aurait au passage creusé l'écart face à des R9 290 qui sont bien plus performantes - et certes bien plus gourmandes - tout en n'étant finalement que 50 € au-dessus des GTX 960 les plus onéreuses.

Concernant les cartes partenaires que nous avons testées, nous n'avons pas encore mis la main sur le modèle idéal. La carte d'Asus, proposée à 240€, n'est pas la plus performante et est relativement bruyante au vu de la faible consommation du GPU GM206, en partie probablement parce que son ventirad n'est pas optimal par rapport à la forme du GPU.

Quant au modèle iChill Ultra d'Inno3D, lancé à 230€, avec un format quelque peu démesuré pour une GTX 960, il est à réserver aux joueurs qui disposent d'un boîtier très spacieux. Il affiche par contre des performances de premier plan et un silence bienvenu au niveau de la ventilation. Un point que nous devons préciser puisque notre échantillon souffrait d'un bruit électrique aigu plutôt gênant (coil whine) au niveau de son étage d'alimentation, comme c'est le cas pour la plupart des GTX 960 et 970 (y compris la carte d'Asus) à des niveaux plus ou moins élevés. Ajoutons cependant qu'Inno3D nous a indiqué avoir modifié quelques composants pour réduire le problème après l'avoir constaté sur les premières cartes produites dont fait partie la carte que nous avons testée.

Il serait d'ailleurs temps que Nvidia et AMD s'attaquent sérieusement à ce problème qui devient de plus en plus évident avec la réduction des nuisances sonores en provenance de ventirads toujours plus efficaces.

Mise à jour du 23/01 :

La GeForce GTX 960 Gaming de MSI, que nous venons d'intégrer à ce dossier, est la plus intéressante des 3 variantes que nous avons testées. Certes elle est loin d'être compacte, mais sans faire autant dans la démesure que le modèle d'Inno3D, elle est totalement silencieuse... tout du moins suivant le niveau du bruit électrique produit par son alimentation puisqu'elle en souffre également, à un niveau modéré sur l'échantillon testé.