Page 1 - Un retour sur le haut de gamme ?

AMD continue sur sa lancée en proposant aujourd'hui une nouvelle plateforme desktop haut de gamme, pour ne pas dire très haut de gamme baptisée Threadripper, structurée autour de nouvelles cartes mères qui accueillent aujourd'hui des processeurs 12 et 16 coeurs, soit plus que ce que propose aujourd'hui son concurrent. Pour rappel aujourd'hui les Skylake-X se limitent à 10, le 12 coeurs est prévu pour la fin du mois et les modèles au-dessus, jusqu'à 18 coeurs « à partir du 25 septembre », sans plus de précisions.

Une concurrence pas vue depuis le FX ?

Au-delà du simple nombre de coeurs le plus important proposé sur une plateforme « grand public », ce que vise AMD avec le lancement de Threadripper, c'est avant tout relancer l'idée que la marque est de nouveau capable de concurrencer Intel sur le haut de gamme, et s'offrir l'éphémère titre du processeur le plus rapide. Une course à laquelle participait AMD à l'époque, lointaine, des FX (les vrais !).

Reste qu'en plus de remuer un fond de nostalgie chez les plus anciens, ces processeurs ont quelques arguments qui pourraient leur permettre de tirer leur épingle du jeu face à la concurrence sur le bien petit segment du haut de gamme.

On retrouve d'ailleurs certains points communs entre l'offre HEDT (High End Desktop) des deux marques avec 4 canaux mémoires DDR4 par exemple de chaque côté, des TDP largement au-dessus des 100 watts, et des caches L3 amples. Mais au-delà des caractéristiques communes, c'est jusque dans la formule utilisée que l'on retrouve les mêmes choses : là où Intel utilise ses Xeon (ses puces pour serveurs) pour faire une gamme HEDT, AMD fait de même avec ses tout frais Epyc. Ou presque, comme nous allons le voir en détail.

Avant d'aller plus loin, et au cas où vous auriez manqué les épisodes précédents, nous vous renvoyons vers cet article pour une explication de l'architecture Zen et du die Zeppelin utilisé sur Ryzen.

Un Zeppelin, ça sert à tout

Pour ceux qui ne l'auraient pas remarqué, la stratégie d'AMD autour de Zen est très simple : un seul die décliné à toutes les sauces. On a ainsi vu ce die, baptisé Zeppelin, dans les Ryzen 7, Ryzen 5, Ryzen 3, d'improbables portables, et même des CPU serveurs. Tous, sans exception, utilisent le même die Zeppelin.

On ne sera donc pas surpris de voir que Threadripper est conçu autour de quatre Zeppelin. Le chiffre de quatre n'est pas celui qu'AMD aime voir communiqué, officiellement le constructeur aime dire que les Threadripper utilisent deux dies Zeppelin.

Ceux qui ont l'oeil verront que le "Carrier Frame" orange est marqué... SP3 !

Ce n'est pas tout à fait vrai, en pratique Threadripper reprend ni plus ni moins la construction interne d'un Epyc, basé sur l'imposant Socket LGA SP3 et ses 4094 contacts (renommé en socket TR4 pour le coup). La construction interne est aussi identique avec quatre dies, dont seulement deux actifs sur ces modèles, les autres ne « servant » qu'à stabiliser le heatspreader d'après AMD. Reste qu'ils sont bien présents dans le package.

Page 2 - Threadripper en détail

Pour le lancement de Threadripper, AMD aurait réservé les deux meilleurs pourcents de ses dies Zeppelin en stepping B1. Si quatre dies sont présents physiquement, seulement deux sont actifs. Dans tous les cas les CCX sont organisés de manière symétrique, ainsi chaque die du 1920X est configuré en 3+3, comme sur un 1600X par exemple.

Chaque die Zeppelin est pour rappel un SoC qui inclut en plus des huit coeurs, la gestion de 32 lignes PCI Express, deux canaux mémoires, et divers ports SATA/USB.

Threadripper exploite donc ces spécificités, chaque die est relié à quatre slots DIMM sur deux canaux mémoires et chaque die expose ses 32 lignes PCI Express pour obtenir les caractéristiques annoncées par AMD (4 canaux et 64 lignes).

Reste qu'il faut relier ces dies entre eux, et AMD passe pour cela par son Infinity Fabric, la même que celle utilisée pour relier les deux CCX à l'intérieur d'un Zeppelin. La même… ou presque !

AMD a développé son Infinity Fabric pour qu'elle puisse être utilisée partout, que ce soit à l'intérieur des dies d'un CPU (Ryzen), d'un GPU (Vega), des dies, ou même pour relier des sockets entre eux. L'idée derrière cette Infinity Fabric est de créer des blocs réutilisables dans tous les designs du constructeur pour gagner du temps dans le développement. Le protocole de données est basé sur une version améliorée d'HyperTransport, et l'on retrouve une couche de contrôle ainsi qu'une Data Fabric qui n'est ni plus ni moins qu'un switch entre divers interlocuteurs.

Dans le cas de Ryzen, on retrouve sur ce schéma ci-dessus une explication de l'interconnexion interne dans Zeppelin. Chaque CCX (chaque bloc de quatre coeurs) dispose d'un bus cadencé à la fréquence de la mémoire (1200 MHz en DDR4-2400 par exemple) qui le relie au Data Fabric et permettant de transférer 32 octets par cycle (38.4 Go/s de bande passante). De la même manière, chaque contrôleur mémoire dispose du même bus (38.4 Go/s de bande passante) tandis que la partie IO se contente d'un bus cadencé à 600 MHz et donc d'une bande passante théorique de seulement 19.2 Go/s (la bande passante théorique de 16 lignes PCI Express 3.0 est de 15.75 Go/s, et de 24 lignes de 23.6 Go/s).

Sur les 24 lignes, seules 16 sont exploitées sur Ryzen pour des cartes graphiques, quatre sont réservées à l'interconnexion avec le chipset Promontory, et quatre pour le stockage (sous la forme de slots M.2 ou de ports SATA). L'USB « CPU » passe aussi par ce hub, chaque die Zeppelin exposant 4 ports USB 3.0.

Dans le cas de Threadripper, 8 lignes supplémentaires sont disponibles dans chaque die pour les cartes graphiques, montant le total à 48 lignes sur deux dies (l'implémentation exacte dépendra des cartes mères), tandis que 8 lignes par die restent bloquées pour le stockage et l'interconnexion chipset. Bien entendu, un seul die est relié au chipset ce qui permet de réutiliser les 4 lignes de l'autre die pour rajouter un slot M.2 par exemple.

Seuls 7 périphériques PCI Express semblent cependant pouvoir être gérés en simultanée (4 par die dont un chipset), dans le cas improbable ou vous utiliseriez 6 cartes PCI Express x8, un seul SSD M.2 pourra être connecté directement sur les lignes de Threadripper. Un petit détail qui ne fâchera personne.

Le résumé par AMD des interconnexions vu de haut niveau

Nous avons demandé à AMD si, pour compenser l'activation de ces lignes, la fréquence du bus qui relie à l'IOhub avait été augmentée, nous attendons actuellement la réponse (comme d'autres) et mettront à jour cet article lors que nous les auront.

L'autre changement par rapport au schéma ci-dessus pour Ryzen concerne l'interconnexion. Car comme nous vous l'indiquions, AMD utilise aussi son Infinity Fabric comme l'indique ce bien particulier schéma :

Chaque die est représenté en gris, et l'on voit l'interconnexion entre les CCX représentée par le gros symbole infini. Un plus petit symbole infini, à 90°, relie les deux dies. Si nous qualifions le schéma de particulier, c'est parce que la taille des symboles ne représente pas du tout la taille des interconnexions !

De la même manière, l'Infinity Fabric externe est un système de switchs avec un lien jusque chaque die, un lien qui disposerait selon AMD d'une bande passante dans chaque sens (mesurée) de 102.22 Go/s. Un chiffre significativement plus haut que la bande passante théorique que l'on retrouve dans les liens entre les CCX (AMD annonçait en bande passante mesurée 21 Go/s environ). Il y a un facteur de quatre et AMD explique que ce bus fonctionne lui aussi à la fréquence mémoire, mais est quad pumped (4 données par clock) ce qui nous donne 128 octets par cycle.

On pourra donc se poser légitimement la question de pourquoi l'on retrouve un bus externe quatre fois plus rapide que le bus interne qui relie chaque CCX au switch. Au minimum, le bus externe semble au moins deux fois trop grand… ou le bus des CCX deux fois trop petit.

Nous avons demandé à AMD la raison derrière ce design qui nous semble particulièrement asymétrique et attendons encore une réponse au moment de la publication de cet article. On pourrait supposer que le design original comptait possiblement sur une bande passante plus large à l'intérieur des CCX que ce que l'on voit dans le produit final.

Notez enfin pour terminer que si AMD n'utilise aujourd'hui que deux dies, rien n'empêcherait le constructeur en théorie d'en utiliser trois ou quatre. Certes, les cartes mères sont limitées à 4 canaux mémoires mais il est tout à fait possible de ne pas utiliser les lignes PCI Express additionnelles de ces dies ou leurs canaux mémoires et n'en exploiter que les coeurs, au travers de l'Infinity Fabric. Une possibilité qu'AMD pourrait utiliser pour s'attaquer au futur 18 coeurs d'Intel, même si d'autres problèmes pratiques se poseraient en termes de fréquences (nous y reviendrons !) ce qui n'en ferait probablement pas une grande idée.

Page 3 - Threadripper 1950X et 1920X, les cartes mères

Pour ce test, AMD nous a fourni deux Threadripper, les 1950X et 1920X, la gamme comporte pour l'instant quatre modèles pour lesquels quelques détails manquent encore :

Ryzen Threadripper 1950X : 16C/32T, 3.4/3.6/4.0/4.2 GHz, 180W, 999$
Ryzen Threadripper 1920X : 12C/24T, 3.5/3.6/4.0/4.2 GHz, 180W, 799$
Ryzen Threadripper 1920 : 12C/24T, 3.2/?/?/? GHz, 140W, ?$
Ryzen Threadripper 1900X : 8C/16T, 3.8/3.9/4.0/4.2 GHz, ?W, 549$

Le 1900X ne sera lancé que le 31 aout, tandis que le 1920 n'a pas été confirmé par AMD. Le 1900X disposera, comme les autres Threadripper de ce tableau de deux dies actifs.

Malgré le TDP, les fréquences sont plutôt hautes sur les Threadripper. Nous avons en effet montré que le 1800X pouvait consommer plus de 95 watts avec un seul die Ryzen a des fréquences proches voir inférieures (le XFR n'est que de 100 MHz sur le 1800X contre 200 MHz ici). Tenir ces fréquences avec deux dies dans un TDP qui est n'est même pas le double, pour le 1950X, nous parait un challenge assez compliqué à atteindre mais nous verrons ce que cela donne en pratique.

Côté packaging, AMD a fait original avec une énorme boite en polystyrène qui s'ouvre par le milieu, on retrouve à l'intérieur un socle en plastique (qui contient « l'oeil ») et au milieu l'énorme CPU. Car à 128 grammes, Threadripper fait passer Skylake-X et ses 51 grammes pour un poids plume !

Notez que le socket s'ouvre avec un tournevis Torx 1.6mm, AMD ayant la bonne idée d'en fournir un dans la boite. Un adaptateur permettant de fixer un kit de watercooling Asetek (base ronde) est également fourni. Contrairement à nos tests habituels, nous avons d'ailleurs dû nous résoudre à utiliser un kit de watercooling AIO, faute d'adaptateur adéquat pour nos radiateurs habituels.

Un tel poids augmente significativement les risques pour le montage et AMD a trouvé un système original pour éviter les accidents avec ses LGA. Vous remarquerez un cadre orange en plastique autour des Threadripper. Une fois que l'on ouvre le socket de la carte mère, on soulève un second cadre, ce dernier inclus des rails dans lequel on glisse le processeur et son cadre qui sert de guide. Reste à faire basculer ces rails pour placer les pins du LGA en contact avec le processeur. Un montage original et plutôt bien vu de la part d'AMD, et probablement nécessaire pour éviter les accidents vu le poids et la taille des puces !

En ce qui concerne le support mémoire, on retrouve exactement les mêmes limitations que pour les Ryzen classiques. Officiellement avec de la mémoire Single Ranked, 4 barrettes sont supportées jusqu'en DDR4-2667, et l'utilisation de huit barrettes est limité à 2133. 512 Go par canal sont (théoriquement) supportés pour 2 To de mémoire au maximum (Windows 10 est limité à 128 ou 512 Go selon les versions).

Une fois n'est pas coutume, nous avons utilisés deux cartes mères pour nos tests. AMD nous a fourni une carte mère Asus Zenith Extreme, tandis que Gigabyte nous a fourni une X399 Aorus Gaming 7. C'est la carte de Gigabyte que nous avons privilégié pour la majorité des tests (à l'exception d'un test particulier sur lequel nous reviendrons).

Gigabyte X399 Aorus Gaming 7

La carte mère fournie par Gigabyte est au format ATX standard mais ne manque pas d'être remplie. Côté slots PCI Express on en comptera cinq, quatre x16 physiques (deux x16, deux x8) reliés au CPU et un dernier en PCI 2.0 x4 au chipset. Les huit slots mémoires, tout comme les slots PCI Express sont affublés de LEDs pour rester dans la tradition. Côté stockage, on retrouvera 3 slots M2 (deux 11cm entre les slots PCIe et un 8cm à droite du chipset) et huit ports SATA.

Sur la façade arrière on retrouve un port PS/2, huit USB 3.0, deux USB 3.1 (un Type-A, un Type-C) ainsi que les ports réseaux/son. Le son est piloté par un Realtek ALC1220 (avec la suite logicielle Sound Blaster 720) et côté réseau on retrouvera un Killer E2500 et une carte réseau WiFi/BT Intel 802.11ac/BT4.2. Les contrôleurs réseaux Killer n'ont pas notre préférence, nous vous renvoyons à nos tests de cartes mères pour plus de détails.

Parmi les petits détails que l'on a appréciés, on notera le temps d'initialisation de la carte mère et de ses périphériques, largement réduit par rapport à l'autre carte que nous avons eu entre les mains. Des leds de diagnostic sont présentes en cas de problème ce que l'on attend d'une carte de ce prix.

Pour le reste si le design du BIOS de Gigabyte est toujours assez particulier dans sa prise en main et son organisation interne, nous n'avons pas grand-chose à reprocher à cette carte mère au-delà de son prix annoncé autour de 390$ !

Asus Zenith Extreme

L'autre carte que nous avons utilisé est l'Asus Zenith Extreme qui va encore plus loin dans l'ultra haut de gamme avec un prix annoncé aux états unis de 550 dollars. Elle est particulièrement imposante, au format E-ATX (27,7cm de large).

Pour cette carte très haut de gamme, Asus propose quatre slots PCIe x16 physiques (toujours deux x16 et deux x8) ainsi que deux slots supplémentaires en PCIe 2.0 reliés au chipset, un x4 et un x1. Du côté du stockage, on retrouve aussi trois slots M.2, un 80mm est placé sous le capot du radiateur chipset qu'il faudra dévisser, tandis que deux 110mm peuvent être installés sur un riser qui vient s'insérer à côté des slots mémoires. Pratique pour ne pas prendre trop de place. 6 slots SATA et un port U.2 sont également présents.

La façade arrière est assez originale avec la présence de LEDs de couleurs dans les jacks audio. A l'échelle de l'utilisation des LEDs dans le matériel moderne de nos jours, cet usage passerait presque pour élégant. Mieux, juste au-dessus on retrouve un petit écran OLED qui indique en détail les codes de boot avec de petites animations. C'est certes dispensable mais au prix de la carte, ce n'est pas le détail le plus inutile du monde particulièrement lors des longues phases de boot.

Pour les choses plus classiques on retrouve huit ports USB 3.0, deux ports USB 3.1 (un Type-A, un Type-C, et les connecteurs réseaux/sons. Le Gigabit Ethernet est piloté par un contrôleur Intel I211-AT, et l'on trouve aussi un module 801.11ac/BT 4.1 tandis qu'Asus fourni enfin une carte fille 10 Gb Ethernet (avec chipset Aquantia), ce qui justifie une (petite) partie du prix demandé.

D'autres LEDs sont bien entendu incluses mais on s'inquiètera de la présence, dans le bloc de connecteur façade, d'un ventilateur de 4cm de large. Il est présent selon Asus pour améliorer le refroidissement des VRM mais, à l'image de tous les ventilateurs de cette taille, il produit un bruit aigu qu'on qualifiera facilement d'insupportable.

Encore un offset sur le Tctl !

Il était doublement insupportable à cause d'un autre problème que l'on a rencontré avec cette carte au niveau de sa détection des températures. Une faute qui ne repose pas entièrement sur Asus, mais aussi sur AMD qui a décidé d'appliquer un offset de 27° sur la valeur Tctl, par rapport à la température réelle. Et vous l'aurez deviné, les multiples BIOS fournis par Asus avant le lancement ne défalquaient pas correctement ces 27° poussant (une fois de plus) les refroidissements à plein régime.

Ce bug devrait être corrigé (après les tests on l'imagine) mais couplé à la présence du ventilateur de 4cm, le résultat est tout simplement désastreux pour les oreilles en l'état (même en poussant les seuils d'activation au minimum), ce qui nous a valu de préférer effectuer nos tests sur le modèle de Gigabyte qui défalquait correctement les 27° de la température utilisée pour piloter les ventilateurs.

Pour la raison des 27°, AMD reste au minimum confus. Cet offset de température était utilisé pour rappel pour cacher le dépassement de TDP que nous avions constaté sur le 1800X. AMD indique aujourd'hui que cet offset permet de créer des courbes de températures custom pour les systèmes de refroidissement, ce qui est assez contradictoire avec la pratique (moderne) que l'on voit sur les cartes mères Ryzen aujourd'hui ou les BIOS défalquent l'offset manuellement (après de longues tergiversations, il faut le dire) rendant l'argument caduque.

Cet offset encombrant devient compliqué à justifier et on ne comprend pas trop pourquoi AMD n'a pas profité de Threadripper pour éliminer définitivement cet offset qui ne sert non seulement à rien, mais donne une expérience pour le moins mauvaise à ses clients en attendant que les BIOS s'adaptent.

AMD aura au moins eu le mérite d'intervenir auprès des développeurs de logiciels de monitoring, en premier lieu l'auteur de hwinfo64 dont le logiciel donne deux températures désormais, la sonde Tctl « brute » et une valeur Tdie « corrigée » de l'offset. Cela nous semble être la moins mauvaise méthode pour mettre de l'ordre dans ce bourbier crée - complètement inutilement - par AMD.

Et un bonus !

Pour terminer sur un tout autre sujet, vous noterez l'apparition d'un autre processeur dans nos graphiques, le Core i7-7820X d'Intel. Sa présence est exceptionnelle et nous mettrons à jour la semaine prochaine l'article sur les Skylake-X pour vous en dire plus à son sujet, cependant vous pourrez profiter dès cet article de ses chiffres de performances !

Page 4 - UMA, NUMA, Game mode

Utiliser deux dies qui disposent de leurs propres canaux mémoires veut dire qu'il faudra, à un moment ou un autre, que des données stockées dans des barrettes placées sur un die transitent jusqu'à l'autre. Il existe des protocoles pour gérer tout cela, bien entendu.

Mais lorsqu'il s'agit de déterminer exactement sur quelle canal mémoire envoyer les données, les choses sont rapidement plus compliquées, comme nous avions eu l'occasion d'en parler dans ce test d'une plateforme Bi Xeon il y a quelques années.

Un protocole existe, NUMA, pour tenter d'améliorer les choses et qui permet au système d'exploitation de prendre de meilleures décisions en tentant (pour faire simple), de garder les données utilisées par un coeur sur la mémoire la plus proche de lui. Comme toutes les bonnes idées, il y a des contre exemples avec des cas dans lequel les applications sont légèrement plus lentes. AMD a donc décidé, par défaut, de ne pas activer NUMA et de répartir uniformément des données sur les canaux mémoires sans tentatives d'optimisation. L'avantage est que théoriquement, on profite de plus de bande passante mémoire mais à l'inverse, la latence mémoire va être variable (elle est significativement plus élevée lorsque l'on accède des barrettes mémoires de « l'autre » die, d'environ 55ns selon AMD).

Il reste cependant possible d'activer le mode NUMA (qu'AMD appelle mode mémoire local) si l'on le souhaite dans le BIOS, nous avons donc comparé les performances entre les deux modes. Notez que pour les résultats que vous trouverez sur cette page, nous avons utilisé la carte mère d'Asus, plusieurs bugs empêchaient en effet d'utiliser Ryzen Master avec la Gigabyte (nécessaire pour le test suivant, un peu de patience !). Voici les résultats que nous avons obtenus, nous comparons le 1950X en mode UMA (distributed) et NUMA (local), d'abord avec les applications (nous calculons un indice 100 pour le mode par défaut) :

Certaines applications n'aiment pas du tout le mode NUMA, c'est le cas, on avait pu le voir précédemment, des outils de compression comme 7-Zip et WinRAR. Ce qui est beaucoup plus surprenant, c'est de voir le score de Lightroom, un logiciel qui certes nous a habitués à des performances assez aléatoires sous Ryzen, mais qui ici se comporte particulièrement mal. Les applications et le rendu 3D profitent par contre plutôt bien de NUMA mais sur notre moyenne, même si l'on retirait Lightroom, le mode classique resterait 3% devant.

Regardons maintenant ce qui se passe dans les jeux :

On note qu'en fonction des jeux, les résultats sont assez variables. TotalWar perd massivement en performances en mode NUMA, tandis que la plupart des autres jeux voient des gaisn, c'est le cas de Watch Dogs 2 avec 5% et Project Cars avec 12% par exemple. En moyenne sur notre panel, l'écart est de moins d'un pourcent.

Un mode jeu… pour le jeu

Avoir plus de coeurs est rarement une bonne affaire pour le jeu passé un certain seuil, et qui plus est l'architecture mémoire partagée n'est en général pas véritablement bénéfique à ce type d'applications. Pour compenser cela, AMD a décidé de mettre en place un mode jeu qui effectue un certain nombre de changements drastiques :

passage de la mémoire en mode NUMA
désactivation des coeurs d'un die

Le passage en mode jeu s'effectue sous Ryzen Master via un profil crée pour cela, on peut repasser dans le mode normal en choisissant le mode « création ». Passer d'un mode à l'autre nécessite cependant un redémarrage, ce qui est plutôt ennuyeux. La manière dont les coeurs d'un die sont désactivés est assez particulière puisque Ryzen Master utilise bcdedit avec la commande /set numproc. AMD garde le SMT actif dans ce mode.

Le game mode active le "Legacy Compatibility Mode", qui manipule les coeurs actifs via bcdedit ! Les curieux verront un "Extreme Software Application", ce dernier n'est pas modifiable manuellement, semble activé en permanence, et nous n'avons pas de définition exacte sur son fonctionnement (plusieurs, contradictoires, nous ont été données nous nous abstiendrons d'en dire plus !)

Selon AMD, l'idée est de proposer un niveau de performance qui soit au moins équivalent à celui d'un 1800X pour le 1950X. Voyons ce que nous avons mesuré en pratique, nous calculons l'indice 100 sur les performances du Ryzen 7 1800X :

On peut voir qu'en général, Threadripper fait moins bien dans les jeux qu'un 1800X ce qui ne surprendra pas grand monde. Nous aurons l'occasion d'y revenir en détail. Cependant l'activation du mode jeu permet de limiter la casse et retrouver quasi exactement les performances d'un Ryzen 7 1800X ce qui est assez correct.

On pourra toujours râler sur le fait qu'il faille en passer par là mais étant donné le design choisi par AMD pour cette puce, qui ne vise pas particulièrement le monde des joueurs (nous vous renvoyons à la conclusion de notre article sur Skylake-X) on pourra toujours se satisfaire que l'option ait le mérite d'exister !

Page 5 - Overclocking en pratique

Jetons maintenant un oeil sur la question de l'overclocking. S'il s'agit des mêmes dies que pour les Ryzen, il faut cette fois ci en overclocker deux en simultanée ce qui complexifie un peu la tâche en théorie, on verra si en pratique cela se ressent.

Quelques rappels : - Les coefficients multiplicateurs sont débloqués - Le multiplicateur a une granularité de 25 MHz : il faudra régler à 120 pour obtenir 3 GHz - La fréquence de référence, de 100 MHz par défaut, est modifiable mais liée à d'autres telles que celle du PCIe. Il est préférable de ne pas y toucher et de passer par les multiplicateurs, même si certaines cartes haut de gamme utilisent un générateur d'horloge externe permettant de passer outre cette limitation - AMD recommande de ne pas dépasser 1.35V pour un overclocking permanent, nous testons l'OC jusqu'à 1.4V - Lorsque l'on passe en mode "overclocking", en réglant manuellement le multiplicateur, on désactive logiquement les Turbo (le classique, et XFR). Certaines cartes mères permettent de modifier individuellement les P-States pour conserver le Turbo (c'est le cas de la Crosshair VI Hero que nous utilisons pour les tests de Ryzen, la Zenith Extreme dispose aussi de cette possibilité) mais ce n'est pas systématique chez les constructeurs.

A noter qu'AMD a précisé que la température Tctl rapportée par le processeur était basée sur une température physique à laquelle était appliqué un décalage de +27° sur les Threadripper

Si notre Gigabyte corrigeait l'offset, ce n'est pas le cas de l'Asus. Cependant AMD a clarifié au moins la question auprès des développeurs de logiciels pour qu'ils rapportent la température correcte. L'implémentation de hwinfo64, qui indique la valeur Tctl et le Tdie (température réelle) nous parait très raisonnable pour compenser cet offset qui nuit plus qu'autre chose à la plateforme.

Pour l'overclocking, nous avons utilisé la dernière version de Ryzen Master dédiée aux Threadripper. Elle ne propose plus que deux profils « personnalisables » puisque l'on retrouve deux modes fixes, le Game Mode et le Creator Mode que nous avons évoqués sur la page précédente. L'application demandera, parfois, un reboot, même si la logique n'est pas toujours respectée, quelque chose qui était peut être lié au support assez partiel de Ryzen Master sur notre Gigabyte.

On ne blâmera pas forcément le constructeur, Ryzen Master pour Threadripper n'est clairement pas exempt de bug et le support du Game Mode a été ajouté en dernière minute dans les BIOS Asus.

Comme toujours, nous validons nos overclocking sous Prime95 avec des FFT "in-place" de 256K, les processeurs sont cependant refroidis par un watercooling AIO Asetek (brandé Thermaltake) avec un radiateur 360mm. Les tests étant effectués hors boitiers, nous plaçons un ventilateur 12cm en direction des VRM pour garantir un minimum de flux d'air.

Threadripper 1950X

On commence par le modèle 16 coeurs, qui à l'image du 7900X d'Intel n'est pas vraiment à sa fréquence Turbo tous coeurs actif sous Prime, on a noté une fréquence comprise entre 3.5 et 3.6 GHz, qui reste donc au-dessus de la fréquence de base :

Malgré l'écart de surface entre le bloc de water cooling et la taille de l'IHS, on obtient d'excellents résultats, peu ou prou identiques à ce que l'on tenait avec le 1800X. AMD dit utiliser ses meilleurs dies pour Threadripper, il semble que ce soit vrai. Nous sommes surtout surpris de la facilité à faire monter les deux dies de concert.

Nous n'avons pas été au-delà de 1.4V et même à cette tension nous ne tenions pas de manière stable les 4.1 GHz, même si nous n'en étions probablement assez proches (comparativement à nos autres essais avec les divers Ryzen passés entre nos mains).

Page 6 - Consommation, efficacité énergétique

Comme toujours, nous mesurons la consommation et l'efficacité énergétique de nos plateformes. Nous utilisons x264 pour nous permettre de calculer l'efficacité énergétique, que ce soit sur un coeur ou sur tous les coeurs.

Performances sous x264

Nous commençons par les mesures de performances sous x264, la mesure est effectuée sur un thread, et sur le nombre maximal de threads présents sur le processeur :

Sans la moindre surprise les Threadripper dominent dans ce test, même si l'on est loin de doubler les performances d'un 1800X pour le 1950X alors que le scaling entre le 1800X et le 1920X est beaucoup plus logique, nous allons voir pourquoi.

Consommation

Regardons maintenant la consommation, nous la mesurons à la fois à la prise ainsi que sur l'ATX12V :

[ ATX12V (W) ] [ 230V (W) ]

Si l'on regarde la consommation à l'ATX12V, on voit qu'au repos, la consommation est particulièrement réduite. En charge sur plusieurs coeurs on est également assez loin du TDP de 180W, ce qui nous fait nous poser la question de savoir si ces processeurs ne tireraient pas une partie de leur alimentation du connecteur ATX 24 broches. Car quand l'on regarde la consommation de la plateforme, la consommation au repos est significativement plus élevée que pour les plateformes Ryzen ce qui ne se justifie par rien dans le cas de la Gigabyte que nous avons utilisé. Certes, l'utilisation d'un watercooling 360mm et de ses trois ventilateurs peut engendrer un surcout, mais il ne nous parait pas à lui seul compenser l'écart noté.

Dans tous les cas, on note que l'on est loin de consommer deux fois ce que consomme un 1800X ! Et quoi qu'il arrive cette fois, on tient dans le TDP… avec une consommation quasi identique ? Par quel miracle ? Sous x264, nous avons pu voir qu'en pratique, nous n'étions pas exactement à la fréquence que l'on pourrait attendre sur le 1950X :

On est effectivement sous les 3.7 GHz, et même sous la fréquence de base de 3.6 GHz. Nous avons pu voir un tel throttling sous plusieurs applications sur le 1950X même si c'est loin d'être systématique, les applications utilisant AVX semblent les plus touchées, logiquement. La limitation dans notre cas, après de nombreuses vérifications n'était pas thermique, mais liée à la consommation. AMD nous a confirmé qu'un tel throttling était théoriquement possible sans pour autant confirmer complètement. Le 1920X n'exhibait pas un tel comportement dans nos tests, assez logiquement.

Quelque part, il est assez dommage de voir un tel throttling même si dans l'absolu, il est plutôt heureux de voir les Threadripper tenir leur TDP (un dépassement à la 1800X multiplié par deux aurait été compliqué à faire passer). Passer sous la fréquence de base est cependant quelque chose de gênant, même si ce n'est pas la première fois que l'on voit ce comportement chez AMD.

On comprends bien le compromis qu'a tenté de réaliser AMD : proposer les fréquences les plus hautes quitte à ce qu'elles ne soient pas systématiquement tenues lorsque l'on charge tous les coeurs avec des charges AVX. De quoi expliquer l'écart de performance assez léger noté entre le 1920X (qui lui tient la fréquence de 3.7 GHz sous x264) et le 1950X un peu plus haut, et leur consommation identique.

Efficacité énergétique

Nous croisons enfin les données de consommation sur l'ATX12V avec les chiffres de performances, pour obtenir l'efficacité :

Etant donné nos doutes sur la consommation réelle à l'ATX12V nous resterons prudents sur l'interprétation de ces chiffres, mais l'efficacité est plutôt très bonne telle que rapportée.

En bref

Si la consommation à la prise de la plateforme est assez haute, la consommation des Threadripper est contenue dans les limites avancées par le constructeur. C'est une bonne et une mauvaise nouvelle, et on le voit bien dans le fait qu'en pratique le 1920X consomme même très légèrement plus que le 1950X : la fréquence turbo sur tous les coeurs n'est pas tenue sur certaines charges, dont x264 que l'on utilise ici pour nos mesures de consommation.

C'est une bonne nouvelle dans le sens où il est appréciable que les spécifications annoncées soient tenues, même si cela n'est pas sans impact sur les performances. Reste qu'il est possible si on le souhaite de récupérer les performances via un overclocking en réglant manuellement la fréquence.

A titre indicatif, nous avons effectué de nouveau notre bench x264 en réglant la fréquence à 3.7 GHz bloquée sur tous les coeurs et obtenu un gain de performances de 4.3%, ce qui reste somme toute assez réduit ! L'impact du throttling n'est donc pas si important qu'il pourrait y paraitre, même s'il est bien présent et qu'il ne faut en rien l'excuser !

Page 7 - Protocole de test

Pour ce test, nous utilisons la dernière version de notre protocole introduit plus tôt dans l'année.

Pour rappel, ce protocole inaugure plusieurs changements, à commencer par l'utilisation de Windows 10 dans sa version "Anniversary Edition". Afin de limiter la variabilité durant les tests, nous désactivons un maximum de tâches, services, et fonctionnalités qui peuvent se déclencher de manière intempestive. Nous vous renvoyons à l'article ci-dessus pour plus de détails. Notez en prime que pour garantir l'équité, nous désactivons le Core Parking pour les processeurs Ryzen, ce dernier étant actif par défaut sous Windows 10 alors qu'il est désactivé pour les processeurs Intel. Quelque chose qui est désormais corrigé par les pilotes AMD qui installent un profil de performances Windows différent.

Pour la partie processeur, les tests utilisés sont :

7-Zip 16.04
WinRAR 5.40
Visual Studio 2015 Update 3
MinGW 64/GCC 6.2.0
Adobe Lightroom 6.7
DxO Optics Pro 11.2
x264 r2744
x265 2.1 (18/12)
Stockfish 8
Komodo 10
Mental Ray (3ds Max 2017)
V-Ray 3.4

Tous les benchs applicatifs sont lancés deux fois, le système étant redémarré au milieu. Notre protocole est pour rappel automatisé. Nous prenons le meilleur score des deux runs, en pratique la marge d'erreur est très faible. Lightroom, ayant un peu plus de variabilité, est lancé quatre fois.

Nous le verrons mais tous les logiciels ne sont pas capables d'utiliser plus de 16 threads. C'est le cas d'un de nos logiciels de compression.

Et les jeux !

La seconde partie de notre protocole concerne les jeux et là aussi nous avons renouvelé notre sélection de titres.

Les jeux modernes ont beaucoup changé dans leur comportement. Si historiquement les jeux étaient souvent limités par les performances sur un coeur (et donc par la fréquence), de plus en plus de titres tirent parti du multithreading au point que la fréquence n'est plus forcément le facteur limitant. Nous verrons au cas par cas ce qui se passe dans ces jeux.

Un des critères pour l'inclusion dans notre protocole est que le processeur joue un rôle ! Il nous parait strictement inutile de vous montrer des benchmarks où tous les processeurs produisent, à la marge d'erreur près, le même nombre d'images par seconde tout simplement parce que la carte graphique est le facteur limitant. Il est très facile de vous montrer, par exemple en montant la résolution, que deux processeurs font "jeu égal". Cela ne nous parait pas une bonne méthode.

Nous avons donc cherché des jeux modernes où le processeur joue un rôle. Dans tous les cas nous utilisons une scène gourmande pour le processeur, et si possible reproductible (l'intelligence artificielle, tout comme certaines générations aléatoires peuvent ajouter une dose de variabilité dans certains titres).

Nous décrivons dans chaque cas l'endroit où nous effectuons nos mesures et si nous avons cherché des endroits dans les jeux où le processeur est le plus limitant, les scènes choisies restent représentatives de l'expérience réelle.

Côté sélection, nous avons donc retenu :

Project Cars
F1 2016
Civilization VI
Total War : Warhammer
Grand Theft Auto V
Watch Dogs 2
Battlefield 1
Witcher 3

Chaque test est effectué en tout 15 fois (trois fois 5 tests, avec un redémarrage au milieu). Nous vous indiquons la moyenne des 15 résultats.

Certains jeux refusent de démarrer avec 32 threads, c'est le cas de deux titres dans notre protocole, GTA V et F1 2016. Pour le second, nous avons réglé manuellement à 16 threads le nombre utilisable par le jeu via son fichier de configuration (plusieurs mois après le lancement de Ryzen, le bug de détection du SMT n'est toujours pas corrigé !). Pour GTA V, nous vous indiquons le résultat pour le 1950X avec le SMT désactivé de manière exceptionnelle, afin de pouvoir calculer une moyenne.

Configurations de test

Pour être le moins limité possible par la carte graphique, nous avons opté pour une GeForce GTX 1080. Nous overclockons cette dernière légèrement (+100/+400 MHz) tout en utilisant un profil de ventilation très agressif pour limiter l'impact de la variabilité du Turbo Boost 3.0. Nous utilisons les pilotes GeForce 378.49 pour nos tests.

Nous utilisons côté plateformes :

TR4 : Gigabyte X399 Aorus Gaming 7
AM4 : Asus Crosshair VI Hero
AM3+ : Asus Sabertooth 990FX R2.0
LGA 2066 : Asus X299-A
LGA 2011-v3 : Asus X99-Deluxe
LGA 1151 : Asus Z170-A
LGA 1150 : Asus Z97-A
LGA 1155 : Asus P8Z77-V Pro

Côté mémoire, nous utilisons 16 Go de RAM sous la forme de 4 barrettes. Selon ce que supportent les plateformes, il s'agit de :

DDR4-2400 15-15-15-35 1T
DDR3-1600 9-9-9-24 1T

Enfin, pour être complet, nous utilisons un bloc d'alimentation Seasonic Platinum 660 (80 Plus Platinum).

Passons enfin aux performances !

Page 8 - Compression : 7-Zip et WinRAR

Nous commençons notre tour des applications par les logiciels de compression de fichiers. Comme indiqué plus tôt dans l'article, nous utilisons le mode mémoire par défaut, UMA (également appelé Distributed par AMD)

7-Zip 16.04

Nous compressons un répertoire d'Arma II (un peu plus de 3.5 Go) avec le logiciel de compression 7-Zip. Nous utilisons l'algorithme de compression le plus performant, à savoir le LZMA2 en mode maximal (9).

Les choses commencent plutôt bien pour Threadripper dans ce test, tout du moins pour le 1950X qui prend sans conteste la tête dans ce test de compression, réduisant de 18.7% le temps de compression par rapport au tout frais 7900X d'Intel. Même le vénérable 6950X est battu dans ce test ! La prestation du 1920X est un peu plus modeste, le gain étant particulièrement mesuré par rapport au 1800X.

WinRAR 5.40

Nous compressons toujours un répertoire d'Arma II, mais ce dernier est un peu plus gros (7.5 Go, il inclut des extensions). Nous jouons sur la quantité de fichiers pour obtenir des temps de benchmarks satisfaisants, il ne s'agit en aucun cas de comparer directement les deux logiciels (une comparaison de la taille des fichiers obtenus s'imposerait). Nous utilisons le mode de compression Ultra qui tire parti du multithreading.

WinRAR fait partie de ces logiciels originaux qui ne gèrent pas plus de 16 threads, ce qui réduit l'avantage des Threadripper. On se retrouve même dans une situation cocasse avec un 1920X qui dépasse le 1950X, les 16 threads étant mieux étalées sur les deux dies sur ce processeur que sur son grand frère.

On espère qu'une prochaine version de WinRAR permettra d'utiliser plus de threads, la version 5.50 actuellement en beta ne semble pas le prendre en compte si on se fie aux release notes du développeur.

Page 9 - Compilation : Visual Studio et MinGW-w64/GCC

Nous continuons avec les compilateurs C/C++.

Visual Studio 2015 Update 3

Nous compilons les bibliothèques C++ Boost avec le compilateur de Visual Studio 2015 Update 3 en édition Community.

Les Threadripper se sont rapidement remis de l'affront subi sous WinRAR, le 1950X étant 16% plus rapide que le 7900X qui dominait ce test jusqu'ici. Le 1920X fait aussi une très belle prestation en talonnant le 10 coeur d'Intel. Par rapport au 1800X il est presque 30% plus rapide.

MinGW 64/GCC 6.2.0

Nous compilons là aussi les bibliothèques C++ Boost avec la version 6.2.0 de GCC sous l'environnement MinGW 64.

La situation est toujours à l'avantage du 1950X même si le temps de compression n'est réduit que de 11%. Le 1920X fait là aussi une belle prestation face au 1800X.

Page 10 - Encodage vidéo : x264 et x265

Poursuivons maintenant avec les logiciels d'encodage vidéo.

x264 r2744

Nous encodons un extrait de Blu-Ray (1080p) d'une minute environ ayant un débit moyen de 23 Mbps. La version de x264 (64 bits) utilisée est compilée par komisar avec GCC 4.9.2.

Nous utilisons le preset slower sur un encodage mode CRF (facteur 20). Une version récente de FFmpeg officie comme serveur d'image.

Les options exactes utilisées sont :

--preset slower --tune grain --crf 20 --ssim --psnr

Nous avions légèrement gâché le suspens sur la page consommation, si le 1920X fait un score excellent face au 1800X, montant les performances de 42.2%, l'écart entre un 1950X et un 1920X n'est que de 14.8%. La cause en grande partie au throttling que nous avons constaté qui fait perdre un peu plus de 4% de performances au 1950X.

Si l'on met de côté cela, on notera que les deux Threadripper font mieux que le 7900X, respectivement de 10 et 26%.

x265 2.1 (18/12)

Nous encodons le même extrait de Blu-Ray avec une version de x265 (64 bits) cross-compilée avec MinGW .

Nous utilisons le preset slower sur un encodage en mode CRF (facteur 16) en activant des optimisations psychovisuelles.

Les options utilisées sont :

--crf 16 --preset slower --me hex --no-rect --no-amp --rd 4 --aq-mode 2 --aq-strength 0.5 --psy-rd 1.0 --psy-rdoq 0.1 --bframes 3 --min-keyint 1 --ipratio 1.1 --pbratio 1.1 --ssim --psnr

Les choses sont un peu plus serrés sous x265. Il faut préciser que contrairement à x264, x265 a plus de mal à tirer pleinement partie d'un nombre important de coeurs en 1080p, ce serait plus le cas en 4K. Le 1950X se détache tout de même de 4% par rapport au 7900X. Le 1920X de son côté fait légèrement mieux que le 7820X.

Page 11 - IA d'échecs : Stockfish et Komodo

Passons à cette particularité de notre protocole de test, les IA d'échecs !

Stockfish 8

Nous utilisons la dernière version en date du moteur d'échecs open source Stockfish, l'un des deux meilleurs moteurs du moment. Trois exécutables sont disponibles, une version basique 64 bits, une version SSE4 (popcnt) et une version BMI (Haswell et supérieurs). Nous lançons les trois versions à la suite et récupérons le meilleur score des trois.

Nous laissons tourner le moteur jusqu'au 31ème tour en début de partie, puis nous notons la vitesse, exprimée en Kilonoeuds par seconde

Le test est réalisé dans l'interface Arena en version 3.5.1.

Stockfish réussissait à la fois très bien à Ryzen et aux Skylake-X, et sans surprise Threadripper s'en tire très bien. Le 1920X fait 91% de mieux que le 1600X a titre indicatif, un des meilleurs scalings que l'on ait vu en passant d'un à deux dies. Le passage 1800X vers 1950X ne se traduit que par un gain de 85%, nous avons noté un léger throttling dans ce logiciel également. Ceci étant, le 1920X dépasse (d'un cheveu) le 7900X tandis que le 1950X se place 30% devant.

Komodo 10

L'autre moteur que nous testons est Komodo. Ce moteur commercial est passé devant Stockfish et Houdini dans les derniers classements. Contrairement à Stockfish, un seul exécutable est fourni. Nous utilisons là aussi l'interface Arena pour réaliser le test.

Nous laissons tourner le moteur jusqu'au 29ème tour en début de partie, puis nous notons la vitesse, exprimée en Kilonoeuds par seconde.

Le scaling est un peu plus mesuré par rapport aux versions mono-die des Threadripper, mais de peu. Par rapport à la concurrence par contre les gains sont bien meilleurs, le 1920X est 14% devant le 7900X d'Intel, et le 1950X 45% !

Page 12 - Traitement photos : Lightroom et DxO Optics Pro

Passons maintenant aux traitements de photos RAW.

Lightroom 6.7

Nous utilisons la version 6.7 d'Adobe Lightroom. Nous désactivons l'accélération GPU et effectuons des traitements d'export avec notamment une correction d'objectif.

Le niveau de multithreading n'a pas beaucoup été amélioré par rapport à l'ancienne version que nous utilisions, nous continuons donc d'effectuer deux exports JPEG en parallèle de deux lots de 96 photos issues d'un Canon 5D Mark II.

De manière assez surprenante, Lightroom réussit plutôt bien aux Threadripper qui réduisent nettement le temps de traitement, d'un tiers environ par rapport au 1800X. Le 1950X égale le 6950X, qui dominait jusqu'ici ce graphique

On notera que le 7820X fait un petit peu mieux que le 7900X dans ce test, ce qui ne manquera pas de nous étonner une fois de plus, le comportement de ce logiciel étant très particulier d'une architecture à l'autre.

DxO Optics Pro 11.2

Nous utilisons la version 11.2 du logiciel Optics Pro de DxO. Nous traitons cette fois-ci 48 photos RAW issues d'un 5D Mark II auxquelles nous appliquons diverses retouches (compensation d'exposition, réduction du bruit, corrections optiques, etc).

Nous réglons le nombre de photos à traiter en parallèle sur le nombre de coeurs physiques présents sur le processeur (le maximum autorisé par le logiciel).

Sous DxO également, le temps de traitement est réduit d'un tiers entre un 1800X et un 1950X, le 1920X bat une fois de plus le 7900X.

Page 13 - Rendu 3D : Mental Ray et V-Ray

Enfin, pour terminer notre tour applicatif, regardons les performances dans les moteurs de rendu 3D.

Mental Ray

Nous lançons le rendu d'une scène préparée par Evermotion. Nous utilisons la version de Mental Ray incluse dans 3ds Max 2017, le rendu est effectué en 480 par 300 afin de conserver un temps de test convenable.

On est une fois de plus surpris de la variabilité des écarts entre le 1950X et le 1920X, qui font quasi jeu égal dans ce test. Le 7900X reste cette fois devant.

V-Ray 3.4

Nous utilisons le moteur de rendu alternatif V-Ray, toujours sous 3ds Max 2017 pour rendre une version adaptée de notre scène. Le rendu est effectué cette fois-ci en 1200 par 750.

V-Ray nous donne des écarts un peu plus logiques mais dans ce titre, le 7900X reste devant avec 4% d'avance.

Allons voir maintenant ce qui se passe dans les jeux !

Page 14 - Jeux 3D : Project Cars et F1 2016

Nous continuons avec les jeux, en regardant d'abord les performances dans deux simulations de course automobile. Tous nos tests sont réalisés en 1080p. Comme indiqué précédemment, nous avons choisi des jeux, des réglages graphiques ainsi que des scènes qui soient à la fois représentatives de l'expérience de jeu, et où le processeur peut faire la différence. Vous présenter des benchs dans des situations où seul le GPU fait la différence, et donc où tous les processeurs auraient le même score, n'aurait strictement aucun intérêt.

Project Cars

Nous regardons les performances sous l'excellent Project Cars, dans sa version 64 bits. Nous mesurons les performances sur 20 secondes lors d'un départ sur le circuit "California Highway Etape 1" dans une course de GT3. Le jeu est réglé en mode Ultra avec l'anti-aliasing désactivé.

Project Cars est un cas typique de ce qui se passe lorsque l'on augmente le nombre de coeurs, de la même manière que l'on voit un 7820X plus performant qu'un 7900X, le 1800X est plus rapide que le 1920X dans ce test, lui-même plus rapide que le 1950X. Les jeux modernes sont loin d'être tous adaptés à ce type de plateformes. Malgré tout, les performances des deux Threadripper restent tout à fait acceptables à côté des Skylake-X et des Ryzen 7. Le fait que ces plateformes ne soient pas les meilleurs compromis pour jouer ne devrait plus surprendre personne en 2017.

F1 2016

La dernière version en date du jeu de F1 de Codemasters utilise un nouveau moteur plus moderne et mieux threadé.

Nous mesurons les performances via le benchmark intégré sur le circuit de Melbourne, sous la pluie. Le jeu est réglé en mode Ultra et nous baissons d'un cran les réflexions, baissons au maximum le post processing, le flou et désactivons l'occlusion. Ces options impactent toutes la charge GPU : en les désactivant on se retrouve moins limité par la carte graphique. Notez qu'il serait possible d'être encore moins limité en baissant d'autres options, cependant contrairement à celles que nous avons retenues, elles ont un impact parfois très important sur la charge CPU. Notre réglage tente d'être le plus proche d'une utilisation réelle, pour la question de l'utilisation processeur.

Notez cependant qu'en plus de ne pas détecter correctement le SMT sur les Ryzen et donc les Threadripper (les mois se succèdent et toujours pas de patch, que fait Codemasters ?), F1 2016 ne se lance pas avec 32 threads ! Nous réglons manuellement à 16 threads dans le fichier de configuration du jeu pour lui permettre de se lancer.

La mauvaise détection du SMT plombe les perfs des Ryzen dans ce titre, ce qui est assez bien illustré par le fait que le 1950X arrive à faire mieux que les 1920X et 1800X ici. Le 7900X garde un avantage de 10%.

Page 15 - Jeux 3D : Civilization VI et Total War : Warhammer

Nous enchaînons avec deux jeux de stratégie.

Civilization VI

La version VI de Civilization apporte là aussi un nouveau moteur qui a la particularité d'être compatible DirectX 12. Nous utilisons ce mode, le jeu est réglé en Ultra avec l'anti-aliasing désactivé. Nous utilisons le benchmark graphique intégré. Il est à noter qu'un benchmark de l'intelligence artificielle est également présent. Malheureusement, celui-ci montre que cette dernière n'est que peu ou pas threadée, ne réagissant qu'à la fréquence ! Dommage pour les joueurs !

Skylake-X, comme Skylake avant lui n'aime pas Civilization VI ce qui permet aux deux Threadripper de faire à peu près jeu égal avec le 7900X. On perd 10% de performance face à un 1800X.

Total War : Warhammer

Ce nouvel opus dans la série des Total War a droit lui aussi à une nouvelle version du moteur graphique de The Creative Assembly. Un mode DirectX 12 est présent, mais il est malheureusement significativement moins performant sur notre GeForce GTX 1080 de test. Nous utilisons donc le mode DirectX 11. Nous mesurons les performances sur la première scène de campagne du jeu. Un benchmark est également intégré au jeu, et s'il semble gourmand à l'oeil, en pratique il ne l'est pas du tout pour le processeur.

Dans Total War, la situation reste compliquée pour le 7900X, 16.7% derrière le 6950X. Le 7740X reste 1.3% devant le 7700K et domine ce test. Et une fois de plus, le Ryzen 7 1700 est devant le 7900X…

Page 16 - Jeux 3D : GTA V et Watch Dogs 2

Poursuivons maintenant avec deux titres en mode ouvert particulièrement gourmands.

Grand Theft Auto V

Pour la cinquième itération de son jeu phare, Rockstar a proposé un portage PC beaucoup plus intéressant que pour la quatrième version. Le moteur profite en prime bien du multithreading. Nous utilisons le benchmark intégré au jeu, en choisissant la pass 4 proposée (la scène la plus gourmande et la plus représentative pour le processeur). Le jeu est réglé en Ultra sans anti-aliasing.

GTA V ne se lance pas non plus avec 32 threads, nous vous donnons le score SMT off de manière exceptionnelle sur ce titre pour le Threadripper 1950X. En pratique si le 1800X est plus performant, les deux Threadripper gardent 9% d'avance face au Core i9-7900X

Watch Dogs 2

Le titre d'Ubisoft dispose lui aussi d'un moteur particulièrement bien threadé. Nous mesurons les performances sur un déplacement dans une zone particulièrement dense et gourmande de la ville. Le jeu est réglé en mode Ultra, nous désactivons le SSAO.

Sous Watch Dogs 2, on perd 4,6% de performances entre un 1950X et un 1800X, l'avantage du Core i9 7900X est de 14% dans ce titre.

Page 17 - Jeux 3D : Battlefield 1 et The Witcher 3

Passons aux deux derniers titres de notre comparatif :

Battlefield 1

Ce dernier opus dans la série des Battlefield utilise le moteur Frostbite 3 de Dice. Si ce moteur dispose d'un mode DX12, là encore il est moins performant sur notre GeForce GTX 1080, nous testons donc en DX11. Malgré tout, le Frostbite 3 est très multithreadé. Nous mesurons les performances sur un déplacement prédéfini dans une zone particulièrement gourmande. Le jeu est réglé en mode Ultra, nous réglons le FOV au maximum (105°). Pour éviter la limite GPU, nous désactivons le HBAO et réglons l'éclairage sur élevé, et nous passons le post-traitement en mode normal.

L'avance du Core i9-7900X dans Battlefield est de 2.3%, ce qui est assez restreint. Il faut dire que Skylake-X est en net recul face aux Broadwell comme nous avions pu le voir dans l'article qui leur était consacré.

The Witcher 3

Nous terminons sur le très populaire The Witcher 3 de CD Projekt RED. Nous mesurons les performances sur un déplacement prédéfini en entrant dans une partie gourmande de la ville de Novigrad.

La perte de performance par rapport à un 1800X est plutôt mesurée, -2.9% de performances. Le 7900X reste devant de 7% même si l'on note que le 7820X fait un peu mieux là aussi.

Page 18 - Indices de performance

Voyons maintenant ce que tout cela donne lorsque nous calculons nos indices. Nous utilisons le Core i5 2500K comme indice 100, même si pour plus de lisibilité nous ne l'affichons pas dans ce graphique. Vous pouvez le retrouver dans nos articles précédents en cas de nostalgie.

Moyenne applicative

Un processeur avec un grand nombre de coeurs est fait pour briller dans l'applicatif, et sans surprise, les Threadripper s'en tirent très bien. Les gains en moyenne sont intéréssants par rapport aux versions classiques de Ryzen. Face au Ryzen 5 1600X (processeur 6C), le 1920X et ses 12C est 64% plus performant, tandis que le 1950X et ses seize coeurs propose 52.7% de performances en plus qu'un 1800X. Certains trouveront que ce n'est pas assez, et que l'on aurait pu espérer un peu plus, mais ils n'ont probablement pas pris en compte la question du TDP que le 1800X ne respectait pas en consommant allègrement plus que ses 95 watts alloués.

Face à la génération précédente d'Intel représenté par le toujours très cher Core i7 6950X, les deux nouveaux venus font respectivement 8 et 27% de mieux. Un écart qui se tasse légèrement face au nouveau venu, le Skylake-X Core i9-7900X qui reste lui plus performant de 3% que le 1920X, tandis que le 1950X, du haut de ses seize coeurs, prends 14% d'avance. Intel pourra toujours se targuer d'avoir, a nombre de coeurs égal, un avantage sur les performances mais si l'on prend en compte le prix, Threadripper trouve correctement sa place dans le marché, certes limité, des machines de bureau très haut de gamme.

Moyenne en jeux 3D

En moyenne, on retrouve un déficit de 6% de performances entre un Ryzen 7 1800X et un 1950X, un niveau de performances qui reste assez correct par rapport aux plateformes concurrentes, le Core i9-7900X ne faisant mieux que de 3.5%.

AMD peut cependant se targuer d'un avantage, la capacité de reconfigurer ses Threadripper en des puces mono dies, plus performantes. Comme nous l'avons vu précédemment, utiliser Ryzen Master pour passer le 1950X en Game Mode lui donne les performances d'un Ryzen 7 1800X. Est-ce indispensable, pour quelques petits pourcents ? Chacun se fera son idée, et si l'on pourra trouver la solution un peu lourde voir bancale, triturant Windows avec bcdedit et nécessitant en prime un reboot, elle a le mérite d'exister.

Page 19 - Un retour en forme Epyc ?

Avec Zen, AMD a marqué après une trop longue absence son retour sur le premier plan dans le monde du processeur x86. Certes, la copie n'était pas parfaite, mais au-delà des défauts, AMD a réussi à secouer son concurrent de toujours qui a dû bouleverser par deux fois ses plans, en avançant d'abord le lancement de ses futures puces 6 coeurs sur sa plateforme grand public, puis en ajoutant en dernière minute des références 14 à 18 coeurs dans sa gamme Skylake-X. Ce dernier ajout à une gamme qui aurait dû s'arrêter à 12 coeurs est bien évidemment lié à l'annonce de Threadripper. Perdre la guerre - fort futile - du plus grand nombre de coeurs n'était pas envisageable pour la firme de Santa Clara.

D'aucuns argueront que la formule utilisée par AMD pour Threadripper est inélégante. Reprendre un Socket si large pouvant accueillir quatre dies pour n'en activer que deux est particulier. Le choix du TDP, fixé à 180W (le maximum supporté actuellement par les Epyc) ne supporterait en pratique que difficilement l'utilisation de quatre dies sans limiter fortement les fréquences. Cela ne veut pas dire qu'AMD ne s'y risquera pas pour ennuyer son concurrent d'un point de vue marketing, la plateforme le permettrait, mais lorsque l'on regarde les caractéristiques des plus gros Epyc 32 coeurs qui utilisent les quatre dies pour toujours 180W, la fréquence est bien évidemment plus contenue (2.0 GHz de base et 3.0 GHz en Turbo) ce qui rendrait le positionnement assez difficile pour des plateformes desktop. Le TDP reste un problème et même Intel devra s'y confronter avec ses futurs Core i9 dont les fréquences de base annoncées sont également assez basses (2.6 GHz pour son modèle 18 coeurs, 4.2 à 4.4 GHz en Turbo).

En ce qui concerne le choix d'utiliser plusieurs dies reliés par l'Infinity Fabric, c'est probablement en pratique moins un problème que la vitesse d'interconnexion de cette Infinity Fabric entre deux CCX, assez ironiquement. Globalement, les constructeurs se retrouvent dans des situations complexes pour faire monter le nombre de coeurs et aucune des solutions choisies n'est parfaite. Nous avons pu voir le prix payé par Intel sur ses performances par les Skylake-X avec l'utilisation de son Mesh Interconnect. A chacun ses concessions en pratique pour des résultats qui ne diffèrent au final pas tant que cela.

Pour les deux Threadripper que nous avons pu tester, on voit qu'AMD a poussé les fréquences au maximum, voire un peu trop pour le 1950X qui dans certains cas ne peux pas tenir pleinement sa fréquence dans l'enveloppe thermique qui lui est allouée - on a noté un déficit de performances de 4% dans x264 pour rappel.

Reste que côté performances les Threadripper remuent sévèrement l'ultra haut de gamme. En applicatif, le 1920X annoncé à 799$ n'est que 3% derrière l'actuel plus haut de gamme d'Intel, le Core i9-7900X vendu 200 dollars de plus. Le 1950X, vendu au même prix que le Core i9 est 14% plus performant en moyenne. On ne doute pas que les Core i9 14 à 18 coeurs reprendront les devant, même si là aussi Intel sera confronté à la même question des fréquences et du TDP, tout en étant plus contenu à 165 watts. Et les prix seront tout autres.

Dans les jeux, la situation est un peu moins favorable puisque les deux Threadripper sont devancés par le 7900X, de 3.5% ce qui empêchera AMD de clamer une victoire totale. Le constructeur propose cependant avec Ryzen Master son « Game Mode », qui permet de récupérer les performances d'un Ryzen 7 1800X sur un 1950X, et donc clamer avec quelques astérisques une victoire dans les jeux. C'est là aussi peu élégant, on pourra discuter de l'intérêt pour quelques pourcents, mais la possibilité existe.

Côté reproches, si l'on passera rapidement sur l'offset de 27° appliqué aux températures il est plus nécessaire de s'arrêter sur le cas des cartes mères. Car si les cartes Skylake-X ne sont pas particulièrement données, celles pour Threadripper montent un palier tarifaire supplémentaire avec un ticket d'entrée à peine sous les 400 euros. Certes, les VRM sont amplement dimensionnées, le socket dispose d'un (joli) rail, les slots se multiplient et les lignes PCI Express sont à router en plus grand nombre… mais tout de même !

On peut espérer dans les semaines à venir voir un réalignement, ne serait-ce qu'avec l'offre X299, ce qui nous paraîtrait un minimum. Le surcoût en attendant sera à prendre en compte dans la décision d'achat si vous faites partie de ceux qui sont potentiellement intéressés par cette plateforme.

Car à l'image de Skylake-X, Threadripper n'est clairement pas fait pour tout le monde. Que ce soit par leur prix, leur consommation, ou leur profil de performances particulier, ces deux plateformes s'adressent avant tout au marché applicatif lourd, ceux qui ont besoin de beaucoup de coeurs CPU et pour qui le jeu, bien que possible, n'est pas la priorité première. Sur ce marché restreint, Threadripper secoue fortement une offre Intel trop longtemps esseulée !