HardWare.fr


Intel Core i9-7960X et Core i9-7980XE : 18 coeurs, presque trop ?
Processeurs
Publié le Lundi 25 Septembre 2017 par Guillaume Louel

URL: /articles/969-1/intel-core-i9-7960x-core-i9-7980xe-18-coeurs-presque-trop.html


Page 1 - De 10 à 18 coeurs en une génération

Après une première vague de modèles lancés fin juin, c'est aujourd'hui la seconde vague de Skylake-X qui sont lancés aujourd'hui par Intel, qui pousse le nombre de coeurs maximal à 18 !

Un sacré bond en avant quand l'on considère qu'il a fallu attendre de longues années pour en avoir plus de 8 ! En effet alors que Broadwell-E était le premier processeur desktop d'Intel a proposer 10 coeurs, il aura fallu que la concurrence se réveille pour qu'arrivent aujourd'hui ces Skylake-X qui n'étaient pas prévus. Sans Threadripper, nous aurions du nous contenter de 12 coeurs en effet !

Une interconnexion mesh...

Nous avons eu l'occasion de vous présenter en détails l'architecture de Skylake-X dans cet article. On retiendra deux changements fondamentaux, tout d'abord le premier au niveau des interconnexions utilisées pour relier les coeurs. Exit les ring bus pour relier les caches entre eux, Intel a préféré utiliser une interconnexion dite "mesh".

Cette interconnexion relie les coeurs dans deux directions(on voit des lignes horizontales et verticales sur le schéma ci dessus), ce qui fait que pour communiquer, les puces doivent se déplacer sur deux axes. Ce n'est pas la première fois qu'Intel utilise ce type d'interconnexion, il travaille même sur le sujet depuis de longues années avec son projet de recherche MIC (Many Integrated Core)  dont les Xeon Phi sont l'une des applications commerciales.

Sur ces derniers, Intel utilise déjà un mesh avec un mécanisme de routage rudimentaire : les données effectuent d'abord leur déplacement vertical, puis leur déplacement horizontal. Le constructeur ne communique (toujours) pas sur la stratégie de routage utilisée sur les Skylake-X et l'on supposera donc qu'elle est similaire. Si l'on s'attarde sur ce point, c'est que nous avons noté des conséquences, particulièrement sur la latence mémoire (les contrôleurs mémoires partagent également leurs données via le "mesh") et la bande passante entre les caches qui chute de manière assez drastique.

Nous nous étions posés la question de savoir si l'un des problèmes rencontrés par l'interconnexion mesh ne venait pas du fait que le nombre de coeurs soit trop réduit, et donc le mesh trop petit pour être utile.

Pour rappel, les processeurs desktop haut de gamme Intel (HEDT) utilisent les divers dies que le constructeur utilise pour sa gamme Xeon. Dans le cas des modèles 10C, il s'agissait des dies dit LCC (Low Core Count), les plus petits.

Enfin un die MCC !

Dans le cas des deux processeurs que nous testons aujourd'hui, nous retrouvons cependant un die MCC, le deuxième die des Xeon qui comporterait (Intel ne le confirme toujours pas !) 18 coeurs (le LCC serait limité à 10).

Sur cette photo fournie par le constructeur, on retrouve ce qui devrait être un die MCC. On voit clairement le design répétitif, chaque coeur étant représenté par un des rectangles. On en compte 20, mais seulement 18 ont le même look. En deuxième position sur la ligne du haut et du bas, on voit des blocs avec une structure légèrement différente. Il s'agit vraisemblablement des blocs qui contiennent les contrôleurs mémoires.

Chaque bloc semble contenir en pratique un contrôleur triple canal, dont seulement deux sont actifs pour les Skylake-X desktop (sur les déclinaisons Xeon, les six canaux sont exploités).

Page 2 - Core i9-7960X et Core i9-7980XE

Pour ce test, Intel nous a fourni ses deux références les plus haut de gamme parmis les Skylake-X, le Core i9-7960X et le Core i9-7980XE.

Pour rappel, la gamme Skylake-X ressemble à ceci :

Une lecture rapide du tableau laisse penser que la fréquence Turbo ne bouge pas vraiment, on ne perd que 100 MHz par rapport aux i9-7900X et i7-7820X. La fréquence de base baisse par contre significativement, à 2.8 et 2.6 GHz respectivement.

Bien évidemment, Intel communique sur la fréquence avec le plus petit nombre de coeurs actifs, ce qui n'est pas très représentatif. Le constructeur nous a tout de même communiqué ces ratios pour toutes les configurations :

  • Core i9-7980XE : <= 2C : 4.2 GHz, <= 4C : 4 GHz, <= 12C : 3.9 GHz, <= 16C : 3.5 GHz, 3.4 GHz au delà de 16C
  • Core i9-7960X : <= 2C : 4.2 GHz, <= 4C : 4 GHz, <= 12C : 3.9 GHz, 3.6 GHz au delà de 12C

Jusque 12 coeurs, les processeurs ont un comportement identique et une fréquence turbo maximale assez haute de 3.9 GHz. Au delà cependant, les fréquences divergent pour nous amener à 3.6 et 3.4 GHz lorsque tous les coeurs sont actifs.

En théorie, le Threadripper 1950X est annoncé a 3.7 GHz tous coeurs actifs, une fréquence qui n'est cependant pas toujours tenue faute de TDP. On verra ce qu'il en sera pour les Skylake-X.

Core i9-7960X

Annoncé à 1699 dollars, le 16 coeurs d'Intel dispose d'un TDP de 165W. On note que sa tension en charge est particulièrement basse, on est sous les 1V. A noter que l'on retrouve une mécanique similaire à ce que l'on a vu sur les Ryzen, lorsque tous les coeurs sont actifs, la tension est généralement plus basse car la fréquence de tous les coeurs est plus basse. Cependant si le nombre de coeurs actifs baisse et que la fréquence monte, la tension augmente même si c'est dans des proportions assez raisonnable (autour de 1.1V). L'effet est donc moins extrême que sur les Ryzen même s'il est notable.

Notez que pour ce prix, Intel ne pratique pas vraiment de segmentation, on a bien droit aux 44 lignes PCI Express par exemple, et les doubles unités AVX-512 sont bien actives.

Core i9-7980XE

Les deux coeurs supplémentaires se font payer très cher par Intel, ce Core i9-7980XE atteint en effet les 1999$ en prix de lancement...

Passé le choc, on note un même comportement avec une tension en charge de 0.892V lorsque tous les coeurs sont en charge, ce qui est assez impressionnant ! Là aussi, aucune segmentation à noter (heureusement...).

Dans les deux cas, le TDP annoncé est de 165 watts.

Tous les tests qui suivent ont été réalisés sur une carte mère Asus X299-A. Vous pouvez retrouver plus de détails sur notre procédure de test sur cet article.

Page 3 - Consommation et efficacité énergétique

# Consommation et efficacité énergétique

Comme toujours, nous mesurons la consommation et l'efficacité énergétique de nos plateformes. Nous utilisons x264 pour nous permettre de calculer l'efficacité énergétique, que ce soit sur un coeur ou sur tous les coeurs.

Performances sous x264

Nous commençons par les mesures de performances sous x264, la mesure est effectuée sur un thread, et sur le nombre maximal de threads présents sur le processeur :


Oui, nous nous sommes également grattés la tête devant ces résultats. En pratique le 7960X fait même légèrement mieux que son grand frère dans ce benchmark... mais les deux sont derrière le Threadripper 1950X.

Plusieurs points à noter, d'abord la question de la fréquence. Le multiplicateur vacillait pour les coeurs autour de 30 à 31 dans les deux cas, ce qui est assez loin des fréquences annoncées ! Notez que dans les deux cas, nous n'étions pas au TDP tel que relevé par la puce (ou nos mesures), et que nous étions très loin des plafonds de température.

Consommation

Regardons maintenant la consommation, nous la mesurons à la fois à la prise ainsi que sur l'ATX12V :


[ 230V (W) ] [ ATX12V (W) ]

Les consommation au repos et sur un coeur sont très légèrement plus elevées que pour le 7900X, ce qui peut se comprendre, le die étant significativement plus gros.

C'est cependant la consommation en charge sur laquelle on s'attardera. Les deux nouveaux venus ont un TDP de 165 watts là où le 7900X se contentait de 140W. Si l'on voit bien un écart, on reste assez loin du TDP théorique. Les sondes internes du processeur relevaient par exemple un peu plus de 140 watts sur ce test sur le 7980X pour vous donner un ordre d'idée (d'autres tests comme Visual Studio par exemple montraient une consommation sur les sondes internes plus élevée, au delà des 150W).

Efficacité énergétique

Nous croisons enfin les données de consommation sur l'ATX12V avec les chiffres de performances, pour obtenir l'efficacité :


Avec une consommation relativement mesurée, l'efficacité est bonne mais reste inférieure à celle d'un 1950X sur ce test.

Page 4 - Overclocking

# Overclocking en pratique

L'overclocking chez Intel reste dans la lignée de ce que l'on connaît. On dispose de deux modes de réglages pour les tensions, soit une tension fixe, soit un réglage par offset, et l'on peut changer les coefficients multiplicateurs soit de manière indépendante en fonction du nombre de coeurs actifs, soit pour tous les coeurs en même temps. Nous choisissons la seconde option.

Tous les réglages sont effectués via le BIOS, l'outil d'overclocking XTU étant toujours très récalcitrant, pour rester poli !

Nous utilisons Prime95 en version 28.10 en mode FFT 256k In-line. Pour réaliser ce test, nous utilisons un (énorme) radiateur Noctua D15 équipé de deux ventilateurs. Nous indiquons la tension (VID), la consommation à la prise ainsi que mesurée à l'ATX12V. La température rapportée est celle des sondes internes du processeur, nous utilisons la sonde « Core Max » de hwinfo64 qui rapport la température maximale des coeurs. Voyons ce que cela donne !

Core i9-7980XE

La première chose a vous indiquer est que sous Prime95, on est très très loin des coefficients turbo max théoriques, avec un multiplicateur qui varie entre 29x et 31x ! C'est particulièrement bas, même si cela reste au dessus de la fréquence de base annoncée...

Monter la tension ne serait ce que légèrement fait augmenter très vite la consommation, et l'on commence a comprendre pourquoi les fréquences relevées en usage normal sont basses en pratique.

Mais malgré tout, la marge d'overclocking n'est pas déraisonnable puisque l'on atteint les 4.2 GHz très facilement avec encore une bonne marge côté température. Certes, notre D15 refroidit fortement mais cela reste correct. La consommation est cependant très élevée.

A 1.1V, les 4.3 GHz n'étaient pas tenus de manière stable. A titre indicatif nous atteignons les 420,9W à la prise et la température montait à 86°. Nous n'avons pas tenté de monter la tension plus haut.

Core i9-7960X

Passons maintenant au "petit" 16 coeurs (on passera sur la même constatation faite sur les fréquences par défaut que pour son grand frère) :

On part de plus haut côté tension mais l'on voit là aussi assez peu de marge aux fréquences d'origine. La consommation monte nettement lorsque tous les coeurs sont overclockés et que leur fréquence n'est plus régulée. 4 GHz est assez raisonnable, au delà il faudra sortir l'artillerie lourde côté refroidissement (CPU et boitier !).

Nous avons poussé jusque 4.4 GHz à 1.150V de tension, le niveau de consommation dépasse les 400W à la prise ce qui est tout de même bien élevé et pas particulièrement raisonnable !

En résumé

Un très grand nombre de coeurs rend l'overclocking compliqué lorsque l'on prend en compte la consommation. Intel s'en sort cependant plutôt très bien en partant de très bas côté tension, on note l'écart très large avec le Core i9-7900 de plus de 0.15V. Cela permet au 16C d'atteindre des fréquences assez hautes même si l'on est vite dans le déraisonnable. Cependant et contrairement au Core i9-7900, la température est moins un problème à des niveaux de consommation équivalents. Le fait d'utiliser un die MCC, plus large, améliore la situation même s'il faudra s'équiper d'un refroidissement très solide. On ne dissipe pas 340 watts facilement !

Page 5 - Performances applicatives

# Performances applicatives

Regardons maintenant les performances applicatives, nous utilisons notre protocole habituel dont vous pourrez retrouver la description dans cet article. Vous pourrez retrouver l'intégralité des informations concernant nos configurations utilisées en bas de cette page.


[ Moyenne applicative ]
[ 7-Zip 16.04 ] [ WinRAR 5.40 ]
[ Visual Studio 2015 Update 3 ] [ GCC 6.2.0 ]
[ x264 r2744 ] [ x265 r2.1.1812 ]
[ Stockfish 8 ] [ Komodo ]
[ Adobe Lightroom 6.7 ] [ DxO Optics Pro 11.2 ]
[ 3ds Max 2017 - Mental Ray ] [ 3ds Max 2017 - V-Ray 3.40.01 ]

Avant de rentrer dans les détails, commençons par une bonne nouvelle pour Intel après la frayeur constatée sous x264 : oui, en moyenne, les deux nouveaux Core i9 se placent devant les Threadripper. A nombre de coeurs égal, l'écart n'est que de 8.3% cependant ce qui est assez faible. On sera surtout circonspect par l'écart réduit entre le 7960X et le 7980XE, même si il faut bien dire qu'une partie de notre protocole n'est pas capable de vraiment tirer partie d'un nombre de threads CPU si important.

L'écart même face au 7900X est assez réduit, mais cela s'explique en partie avec WinRAR qui pour rappel ne supporte pas plus de 16 threads. Les 16 threads sont bloqués sur les 16 premiers coeurs logiques en pratique ce qui plombe assez nettement les performances.

7-Zip est beaucoup plus accommodant et l'on note 37% de gains par rapport au 7900X. Les gains sont également très réduits sur Lightroom ou les Threadripper sont même devant, tandis que sous DxO Pro Optics on note la aussi des gains bien plus nets.

Les tests de compilation et les IA d'échec se comportent très bien également et poussent les écarts vers le haut. Côté compression vidéo c'est effectivement moins bon, x265 talonne complètement sur un encodage 1080p et nous avons déjà vu les gains mesurés sur x264. Si l'on termine sur les applications 3D on voit des gains assez légers sur Mental Ray et bien plus larges sur V-Ray.

Page 6 - Performances jeux 3D

# Performances jeux 3D

Côté jeux, on vous rappellera que nous utilisons une GeForce GTX 1080 pour isoler au maximum l'impact du GPU, vous trouverez plus de détails sur la configuration et notre méthodologie sur cette page :


[ Moyenne jeux 3D ]
[ Project Cars ] [ F1 2016 ]
[ Civilization VI ] [ TotalWar Warhammer ]
[ GTA V ] [ Watch Dogs 2 ]
[ Battlefield 1 ] [ Witcher 3 ]

On ne s'attendait pas forcément à grand chose dans les jeux. En pratique, on retrouve des résultats en moyenne assez proches du Core i9-7900X.

Par rapport à la compétition, Intel se place devant les Threadripper en s'approchant des Ryzen 7. On note cependant que la nouvelle architecture Skylake-X et surtout son interconnexion mesh ne sont pas particulièrement performants dans les jeux ou les anciens Broadwell-E brillaient fortement.

La situation de la fréquence amplifie les écarts et l'on voit nettement les performances chuter dans certains titres sur le 7980XE.

Page 7 - Des processeurs limités par leurs TDP ?

# Des processeurs limités par leurs TDP ?

Afin de voir un peu plus précisément le rapport performances/prix, nous croisons sur un graphique le prix de lancement (nous utilisons les prix officiels conseillés en dollars pour les deux constructeurs) avec les performances applicatives. Afin de garder la lisibilité de ce graphique nous avons réduit le nombre de processeurs, si vous souhaitez en voir plus nous vous renvoyons à notre grand comparatif de processeurs sur cette page.


Sur les performances applicatives, on peut voir que la gamme Skylake-X augmente assez nettement le niveau de performance à prix égal par rapport à la gamme précédente. L'augmentation massive du nombre de coeurs aide, évidemment !

Si l'on regarde les quatre Skylake-X que nous avons pu tester, ils tracent à peu près une ligne droite, mais bien moins agressive que celle de la gamme d'AMD. Et c'est bien là le problème de la nouvelle offre d'Intel : avec un écart de performances qui se limite à 11% pour un prix deux fois supérieur, 1999$ pour rappel, la victoire que s'offre le constructeur sur son concurrent nouvellement réveillé n'est que symbolique !

En pratique, le plus gros problème que nous avons noté est la stratégie de choix de fréquence appliquée par le CPU en charge qui ne semble pas particulièrement agressive, avec une distance par rapport au TDP qui reste souvent importante. En choisissant de se contenter d'un TDP de 165 watts pour un si grand nombre de coeurs (ce n'est que 25 watts de plus que le Core i9-7900X et ses 10 coeurs), Intel s'est imposé des contraintes fortes qui dépassent ce que permet aujourd'hui son process de fabrication 14nm.

Car si la tension de fonctionnement très basse permet de tenir 18 coeurs gourmands pour un niveau de consommation restreint, cela se fait au prix des fréquences qui assez éloignée des multiplicateurs turbo annoncés par le constructeur. Le 14 coeurs, qui dispose d'un TDP identique, devrait être moins limité de ce côté.

L'overclocking permettra bien entendu de mieux tirer parti de ces puces, et nous avons vu que la marge de ce côté est importante. Il faudra par contre être en mesure de refroidir correctement le processeur mais aussi les VRM de la carte mère vu les niveaux de consommation pouvant être atteints.

Reste que même si ces plates-formes peuvent avoir leur intérêt, il ne faut pas perdre de vue qu'il s'agit de marchés de niches qui ont occupés une place plus grande que nécessaire dans l'actualité notamment du fait des lancements en deux voire trois temps chez AMD comme Intel. Plus près des besoins de tout un chacun les yeux se tournent désormais vers les Intel Coffee Lake 6 coeurs, qui répondront cette fois non plus aux Threadripper mais bien aux Ryzen !

Copyright © 1997-2024 HardWare.fr. Tous droits réservés.