HardWare.fr


Intel Core i7-980X : 6 core 32nm !
Processeurs
Publié le Jeudi 11 Mars 2010 par Marc Prieur

URL: /articles/785-1/intel-core-i7-980x-6-core-32nm.html


Page 1 - Introduction



Il y a un peu plus de 16 mois, Intel lançait en grande pompe ses nouveaux processeurs Intel Core i7. Utilisant une nouvelle plate-forme LGA1366, ces processeurs quad-core gravés en 45nm étaient basés sur une nouvelle architecture baptisée Nehalem.

En ce début d’année 2010, Intel récidivait en déclinant l’architecture Nehalem en 32nm et en dual-core au travers des Core i3 et i5 LGA1156 (nom de code Clarkdale). C’est aujourd’hui au tour du LGA1366 de voir débarquer un processeur 32nm, le Core i7-980X, qui est compatible avec les cartes mères X58 existantes via une simple mise à jour de bios.
6 core !
Contrairement à ce qui a été fait avec les Core i3 et i5 32nm, Intel conserve avec le Core i7-980X, nom de code Gulftown, un die monolithique. On retrouve au sein de ce die :

- 6 cœurs avec Hyperthreading (12 cœurs logiques)
- 12 Mo de cache L3
- 1 contrôleur DDR3 tri-canal
- 1 lien QPI 6.4 GT /s


Par rapport aux premiers Core i7 LGA1366, les Bloomfield, la principale différence se situe donc au niveau du nombre de core, passant de 4 à 6, et du cache L3, qui passe de 8 à 12 Mo. Le tout se retrouve donc dans un die de 248mm² comprenant pas moins de 1,17 milliards de transistors gravés en 32nm ! Un Gulftown est donc plus petit qu’un Bloomfield puisque les 731 millions de transistors de ce dernier occupaient 263mm² du fait de la gravure en 45nm.

Le TDP est pour sa part identique, avec 130 watts en charge, alors que la consommation au repos est annoncée à 12 watts seulement. Côté fréquence, tout comme le Core i7-975 Extreme Edition, le Core i7-980X fonctionne à 3.33 GHz. Le Turbo est bien entendu présent et fonctionne à +266 MHz avec un ou 2 cœurs actifs et +133 MHz au délà, ce dans la limite du TDP bien entendu. Extreme Edition oblige, sur le 980X il est possible de personnaliser ce mode Turbo, tant au niveau des coefficients que du TDP.


Intel a profité du passage en 32nm pour faire un changement côté architectural avec l’arrivée de 6 nouvelles instructions SIMD dénommées AES-NI (Advanced Encryption Standard New Instructions). 4 d’entres elles sont destinées à accélérer les opérations d’encryptage et de décryptage, et 2 autres accélèrent la procédure d’extensions de clé.

D’un point de vue historique, il faut rappeler que les processeurs x86 hexacore ne sont pas en soit une nouveauté. Intel avait déjà lancé en septembre 2008 ses Xeon 7400 "Dunnington", composés de 6 core Penryn, de 3 cache L2 de 3 Mo et d’un cache L3 de16 Mo. De son côté AMD a lancé en juin dernier ses Opteron Istanbul, composés de 6 core K10, 6 cache L2 de 512 Ko et d’un cache L3 de 6 Mo. Le Core i7-980X est par contre le premier hexacore fonctionnant sur une plate-forme classique pour PC de bureau, en attendant le Phenom II X6 prévu pour le mois prochain.


Page 2 - Un contrôleur mémoire moins rapide

Un contrôleur mémoire moins rapide
Sur les processeurs LGA1366 Bloomfield, la fréquence de la partie uncore du processeur, qui comprend le contrôleur mémoire et le cache L3 était libre tout en devant être au minimum double de la fréquence mémoire. Ainsi, en partant de la fréquence de référence de la plate-forme de 133 MHz, il fallait faire au moins fonctionner l’uncore à :

- 3.20 GHz en DDR3-1600
- 2.66 GHz en DDR3-1333
- 2.13 GHz en DDR3-1066

Sur Gulftown, c’est différent puisque cette fois-ci un facteur de 1.5 est suffisant. On arrive donc aux valeurs minimales suivantes :

- 2.40 GHz en DDR3-1600
- 2.00 GHz en DDR3-1333
- 1.60 GHz en DDR3-1066

Sur LGA1156, c’est différent puisque le coefficient de l’uncore est fixe à x18 (2.4 GHz) sur Core i7 45nm et Core i5 32nm, x16 (2.13 GHz) sur Core i5 45nm et Core i3 32nm et 2 GHz sur Pentium. Indépendamment de cette fréquence, on peut de base utiliser les modes DDR3-800/1066/1333 sur Core i5 et DDR3-800/1066/1333/1600 sur Core i7.

Intel met en avant la souplesse obtenue en overclocking par cette modification, puisqu’il n’est désormais plus nécessaire d’avoir un uncore fonctionnant très haut pour utiliser de la mémoire DDR3 haute performance. Derrière cet argument semble se cacher une limitation du Gulftown, puisque notre exemplaire de test n’était pas stable en DDR3-1333 avec uncore à 2.66 GHz alors que notre Core i7-975 l’était.

Nous avons tout d’abord voulu observer quel était l’impact sur le cache L3, celui-ci semble inexistant en terme de bande passante puisque nous avons mesuré avec Everest des débits respectifs de 21.3, 12.3 et 16.9 Go /s en lecture, écriture et copie sur i7-980X contre 20.2, 13.1 et 16.5 Go /s sur i7-975. La latence augmente par contre de 13%.


L’impact sur la mémoire est pour sa part bien plus important si l’on s’en réfère à ces résultats obtenus en tri-canal avec en mode DDR3-1066/1333 (7-7-7) et DDR3-1600 (8-8-8) :

En lecture, la baisse est de 12 à 15%, en écriture de 27 à 30% et en copie de 27 à 32%. La latence augmente pour sa part de 14 à 20% ! Bien entendu en pratique l’écart est moindre, puisque par exemple sous 7-zip avec 4 thread le Core i7-980X n’est "que" 3% plus lent que le Core i7-975 avec de la DDR3-1600 8-8-8.


Page 3 - 6 core = triple canal ?

Un 6 core = triple canal ?
La plate-forme LGA1366 est la seule à supporter le tri-canal en DDR3, mais jusqu’alors son intérêt était limité voir inexistant. En effet, si le passage en tri-canal augmente le débit mémoire de 7 à 10% selon la vitesse de la DDR3, la latence augmente de son côté de 15 à 17% ! En pratique, dans la plupart des cas cette différence s’annulait, et l’avantage du tri-canal en pratique était au mieux de l’ordre de 1%, au pire inexistant.

Avec l’arrivée d’un processeur 6 cœur, il est temps de se demander de nouveau si le tri-canal est intéressant. En effet, avec 50% de cœurs d’exécution en plus à alimenter en données, l’intérêt du tri-canal devrait être bien plus prononcé.

Afin de mettre en évidence cette éventuelle gourmandise, il nous fallait une application qui soit à la fois capable de tirer partie de la puissance des 12 core logiques et qui soit gourmande en bande passante mémoire. En effet, nous avons déjà vu par le passé que des les tests de rendu d’image de synthèse et même ceux de compression vidéo était certes très dépendant de la puissance CPU mais qu’il l’était beaucoup moins en ce qui concerne la vitesse mémoire.

A contrario, un logiciel de compression de fichier tel que WinRAR est dépendant de la vitesse mémoire, mais moins de la vitesse processeur même si les choses sont plus équilibrées avec l’introduction du multithreading dans la version 3.9.


Pour ce test, notre choix c’est porté sur 7-zip. Concurrent Open Source de WinRAR, ce dernier intègre en version 9.10 beta un mode compression LZMA2 offrant multithread bien plus poussé que WinRAR. Nous avons limité la taille du dictionnaire à 32 Mo, soit une utilisation mémoire atteignant 3.5 Go avec 12 threads, ceci afin de ne pas avoir de différence lié à la taille mémoire (4 Go en mono-canal, 4 Go en bi-canal et 6 Go en tri-canal). Les tests ont été effectués en DDR3-1066 7-7-7, DDR3-1333 7-7-7 et DDR3-1600 8-8-8.

Maintenez la souris sur le graphique pour visualiser les temps de compressions en secondes.

Sur Core i7-975, le passage de 2 à 3 canaux fait gagner 6%, 4% et 3% en DDR3-1066/1333/1600. Sur Core i7-980X, les gains sont de 12, 9 et 7% ! En tri-canal, le passage de la DDR3-1066 à la DDR3-1333 fait gagner 9.1% sur i7-975 et 11.6% sur l’i7-980X. Passer de la DDR3-1333 à la DDR3-1600 n’entraine qu’un gain faible du fait de l’augmentation de la latence mémoire, avec 1.7% de gain sur i7-975 et 4% sur i7-980X. Au final, en passant d’un canal en DDR3-1066 à trois canaux en DDR3-1600, l’i7-975 est 35.9% plus rapide et cela monte à 63.8% avec l’i7-980X !

Sous ce test spécifique nous avons donc pu démontrer un intérêt au tri-canal sur Core i7-980X, puisque ce dernier est environ 2 fois plus intéressant avec un Gulftown qu’avec un Bloomfield. Il faut toutefois tempérer cet avantage, car s’il est évident sous 7-zip du fait de l’utilisation processeur & mémoire massive de ce logiciel, cela reste une exception. Dans les applications de notre protocole de test habituel, le gain apporté par le tri-canal sur Core i7-980X est compris entre 0 et 3% seulement !


Page 4 - Le cpu, conso, o/c, le test

Le Core i7-980X

A première vue, rien ne permet vraiment de distinguer un Core i7 Bloomfield (à droite) d’un Core i7 Gulftown (à gauche). Une fois retourné, on s’aperçoit que les condensateurs diffèrent.


Intel nous a livré le processeur avec son nouveau ventirad à 4 caloducs, le DBX-B. Il est annoncé à 20 dBA à 800 RPM au minimum, et moins de 35 dBA à 1800 RPM en charge.

Au repos, le Core i7-980X fonctionne à 1.6 GHz et 0.91v, en charge il fonctionne à 3.33 GHz ou plus en fonction du mode Turbo (3.49 GHz ici) et 1.16v.

Consommation
Nous mesurons la consommation de la configuration à la prise l’alimentation utilisée ayant un rendement de l’ordre de 80%. Pour le test en charge, nous avons utilisé Prime95. Attention donc, d'autres composants tels que la carte graphique ou le disque dur sont donc au repos pendant ces mesures.


Conformément aux spécifications annoncées par Intel, le Core i7-980X se situe à un niveau de consommation similaire du Core i7-975, et il est même légèrement moins gourmand en charge comme au repos. La plate-forme LGA1366 reste par contre très énergivore, ce qui peut se comprendre en charge mais moins au repos.
Overclocking
Nous avons bien entendu essayé d’overclocker le Core i7-980X. Cadencé à 3.33 GHz par défaut, il s’est avéré stable jusqu’à 3.7 GHz sans modifier sa tension affichée à 1.16v en charge sous CPU-Z. Avec une tension réglée à 1.35v et affichée à 1.26v effectifs sous CPU-Z, nous sommes parvenus à stabiliser les 4 GHz (25x160). Avec ce réglage, la consommation de la machine en charge passait de 269 watts à 330 watts.


Au passage, attention aux overclockeurs trop bourrins : si en 45nm Intel préconisait de ne pas dépasser les 1.55V faute de quoi le processeur pouvait être endommagé, cette fois il ne faut pas dépasser les 1.4V !
Le test
Pour ce test, nous avons repris le même protocole que celui inauguré pour le test des Core i5. Nous avons pour rappel profité de la disponibilité de Windows 7 en version définitive pour le remettre à plat. Côté OS tout d’abord donc, nous passons donc à Windows 7 en version 64 bits, ce qui implique que tous les logiciels disponibles en 64 bits sont testés dans ce mode.

Les logiciels sont mis à jour, ainsi 3ds max passe de la version 2009 à la version 2010, MinGW est mis à jour tout comme WinRAR (3.8 vers 3.9), After Effects (CS3 vers CS4) et Nuendo (4.2 vers 4.3). Les combos VirtualDub/DiVX et AutoMKV/x264 laissent leur place aux combos Avidemux/x264 et MainConcept Reference/H.264, alors que les fichiers de tests de quasiment tous les tests changent ou sont modifiés (résolution de rendu plus importante par exemple).

Côté jeu, nous avons décidé de conserver Crysis 1.2 et son test CPU ultra-lourd, mais de retirer World In Conflict au profit de nouveaux jeux plus récents et plus gourmands : Arma 2, Grand Theft Auto IV et Anno 1404. Afin de mettre en évidence au maximum les écarts lié au processeur, nous mettons toutes les options graphiques au maximum histoire de le charger plus que de raison, tout en limitant la résolution à 800*600 afin d’éliminer un éventuel lissage par la puissance de la solution mono-GPU utilisée sur la configuration de test.

Les matériel utilisé avec les processeurs est le suivant :

- ASUSTeK P5QC (LGA775)
- Intel DP55KG (LGA1156)
- ASUSTeK P7P55D-EVO (LGA1156 32nm – jeux)
- Intel DX58SO (LGA1366)
- ASUSTeK M4A79-T (AM3)
- ASUSTeK M4A79 (AM2)
- 2x2 Go DDR3-1333 7-7-7
- 2x2 Go DDR3-1066 7-7-7 (si 1333 impossible)
- 2x2 Go DDR2-1066 5-5-5
- GeForce GTX 280 + GeForce 190.62
- Raptor 74 Go + Raptor 150 Go
- Creative Audigy
- Windows 7 64 bits


Page 5 - 3D Studio Max, Cinema 4D

3D Studio Max 2010

Nous débutons par le célèbre logiciel d’image de synthèse, en version 2010 et x64. La scène de test utilisée provient de SPECapc pour 3ds max 9 (space_flyby_mentalray) et elle utilise le moteur de rendu Mental Ray.


Sous ce premier test l’avantage du Core i7-980X sur l’i7-975 est de 42%, contre un avantage maximal théorique de 50% ! Du coup, l’i7-980X est 95% plus véloce qu’un Phenom II X4 965 …
Cinema 4D R11

Le logiciel de rendu de Maxon est célèbre auprès de la communauté des overclockeurs via Cinebench, qui permet de comparer facilement les performances de processeurs. Toutefois, Cinebench utilise la version R10 du moteur de rendu de Cinema 4D, alors que la version R11 double les performances. Nous utilisons cette dernière version en 64 bits, avec la scène de Cinebench R10 rendue dans une résolution plus importante afin d’allonger les temps de rendu.


Cinema4D tire moins parti des 6 core que 3ds puisque le gain se réduit à 34% par rapport à l’i7-975X, ce qui reste tout de même intéressant. L’i7-980X est ici 90% plus rapide que le Phenom II X4 965.


Page 6 - MinGW/GCC, WinRAR

MinGW / GCC

Voici un test applicatif mettant en œuvre la compilation du code source de MAME via GCC sous l’environnement MinGW. Nous utilisons désormais la version 5.1.4 de MinGW alors que c’est le code source de Mame 0.133 qui est compilé.


Sous MinGW l’i7-980X confirme sa supériorité avec 29% de gain par rapport au précédent haut de gamme. Les performances sont également 90% plus élevées que sur le CPU AMD le plus rapide actuellement commercialisé.
WinRAR 3.9

Nous utilisons la version 3.9 64 bits de WinRAR, qui introduit de nouvelles optimisations multithread, pour compresser un ensemble de fichiers.


Si WinRAR 3.9 est multithreadé, l’avantage qu’il tire du passage de 8 à 12 core logique est inexistant si bien que l’i7-975 est 4.5% plus véloce que l’i7-980X, ce dernier étant handicapé par son contrôleur mémoire moins rapide dans ce test. L’avantage final par rapport au Phenom II X4 965 est réduit à 36%.


Page 7 - H.264 : Avidemux, MainConcept

Avidemux + x264

Nos tests vidéos sont utilisent exclusivement l'encodage H.264. Pour commencer, nous utilisons Avidemux dans sa version 2.5.2, qui améliore les performances au delà de 4 thread par rapport à la version 2.5.1, pour compresser via le codec x264 en qualité intermédiaire un fichier vidéo HD 1920*1080.


Avidemux affiche un gain intéressant de 26% en passant de l’i7-975 à l’i7-980X. Ce dernier est 92% plus véloce qu’un Phenom II X4 965.
MainConcept Reference + H.264/AVC Pro

Pour ce deuxième encodage H.264 nous utilisons MainConcept Reference et son codec H.264/AVC Pro en profil « High », toujours sur la même vidéo.


On retrouve un comportement similaire sous MainConcept avec 27% de gain en passant à 6 core. L’avantage par rapport au haut de gamme AMD et de 79%.


Page 8 - After Effects CS4, Nuendo 4.3

After Effects CS4

Adobe After Effects est utilisé en version CS4, nous utilisons une composition utilisant divers effet afin de rendre une animation en 3D, le multitraitement étant activé afin de pouvoir profiter au maximum du nombre de core disponibles.


Sous After Effects l’avantage lié à l’hexacore n’est que de 17%. Ce test se comportant toutefois nettement mieux sur processeur Intel, les performances de l’i7-980X sont quasiment doublées par rapport au Phenom II X4 965 !
Nuendo 4.3

Voici la version 4 de Nuendo, avec la dernier patch 4.3, le tout en 64 bits. Un projet musical utilisant divers plugin natifs ainsi que 2 instances d’instruments virtuels HalionOne est exporté en fichier wave (merci à Draculax).


Nuendo ne tire que peu partie de la présence de 6 core, avec un gain de 13% seulement. L’écart entre les hauts de gamme AMD et Intel est de 64%.


Page 9 - Crysis, Arma 2

Crysis 1.2

Avec le patch 1.2, Crysis propose un bench CPU (trouvable dans les répertoires Bin32/Bin64) très lourd. Le test est effectué avec les détails très élevés, mais en 800*600 afin de limiter la dépendance à la carte graphique.


Surprise, nous sommes ici confrontés à une limitation qui n'est pas liée au processeur mais au GPU, ou tout du moins au duo GPU/Drivers, ce dès le QX9770 et malgré la faible résolution. Ceci lisse malheureusement les résultats à environ 30 fps. L’i7-980X ne parvient donc pas à tirer son épingle du jeu, et les performances sont même d’un cheveu en retrait par rapport au 975, ce qui est probablement du à la fréquence moindre du contrôleur mémoire. L’écart est de 17% avec le Phenom II.
Arma 2

Arma 2 est configuré avec tous les détails au maximum dont une visibilité au maximum soit 10 km, ce qui a pour dont de mettre à genoux les configurations. La résolution reste par contre à 800*600 pour éviter de lisser les performances par la carte graphique. Pour mesurer les performances, nous mesurons le framerate durant un déplacement bien défini après avoir chargé une sauvegarde.


Cette fois il n’est pas question de limitation autre que le processeur, mais malgré tout le Core i7-980X ne tire pas son épingle du jeu, Arma 2 ne tirant pas partie de ses 6 core. A contrario on note une légère baisse des performances, a priori liée à la mémoire. L’avantage par rapport au 965 Black Edition est de 24%.


Page 10 - GTA 4, Anno 1404

Grand Theft Auto IV

GTA IV fait parti de nos tests du fait de sa lourdeur ainsi que de ses optimisations multithread. Encore une fois tous les détails sont poussés au maximum, exception faite des textures pour ne pas dépasser la mémoire vidéo disponible, le tout en 800*600. Nous utilisons le benchmark intégré mais sur une scène faite maison plus lourde que celle proposée par défaut.



GTA IV confirme les résultats obtenus précédemment avec une très légère baisse des performances. L’écart avec le haut de gamme AMD n’est que de 10%.
Anno 1404

Anno 1404 est un jeu de gestion ici testé en détail maximums tout en conservant une résolution de 800*600. Nous utilisons une sauvegarde comportant une cité de 46 600 habitants que nous visualisons en partie depuis une vue éloignée.


Anno 1404 est le plus multithreadé des jeux de notre protocole de test, puisqu’il est capable de tirer partie de plus de 4 core comme le laisse voir le gain lié à l’hyperthreading entre le Core i5-750 et le Xeon X3450. Il ne peut toutefois pas exploiter correctement les 12 core logiques offert par le Core i7-980X et on observe encore une fois une très légère baisse des performances par rapport à l’i7-975. L’avantage sur AMD est ici conséquent, l’i7-980X étant 52% plus véloce que le Phenom II X4 965.


Page 11 - Moyenne

Moyenne
Bien que les résultats de chaque application aient tous un intérêt, nous avons calculé un indice de performances en se basant sur l'ensemble de résultats et en donnant le même poids à chacun des tests. L'indice 100 a été attribué à l’Intel Core 2 Q8200.


En moyenne, le Core i7-980X est 16% plus rapide que le Core i7-975. Bien entendu, ce pourcentage varie grandement selon les applications, puisque nous avons pu mesurer des pertes allant de 4% sur celles ne tirant pas partie des 6 core jusqu’à des gains de 42% !

En termes de performances pures, l’avantage d’Intel sur AMD est écrasant, le Core i7-980X étant 63% plus rapide que le Phenom II X4 965.


Page 12 - Conclusion

Conclusion
Cela ne fait pas de doute, le Core i7-980X est, et de loin, le processeur le plus performant disponible à l’heure actuelle. Véritable démonstration technologique, il impressionne par ses caractéristiques rendues possibles grâce à la maitrise d’Intel en matière de finesse de gravure. Le 32nm permet ainsi au géant de Santa Clara de caser 6 cores et 12 Mo de cache L3 sur un die plus petit que celui en 45nm des versions à 4 cœurs et 8 Mo de L3, le tout pour une consommation qui reste du même ordre !


D’un point de vue technique, le seul petit couac se situe de notre point de vue au niveau du contrôleur mémoire qui est moins rapide que son prédécesseur, mais cela reste de l’anecdotique face aux performances globales. On notera par ailleurs que l’arrivée du Gulftown permet de montrer sous un meilleur jour le tri-canal, qui avait jusqu’alors un intérêt inexistant sur LGA1366.

Mais si le Core i7-980X est une réussite technologique bluffante que tout geek qui se respecte voudrait avoir dans sa machine, cela n’en fait pas pour autant un bon achat aujourd'hui. Premier point, et pas des moindres, comme tout bon "Extreme Edition", il est lancé au tarif exorbitant de 999$. Mais plus important encore, il manque au Core i7-980X, et par extension à tous ses successeurs proposant 6 cœurs physiques et 12 cœurs logiques, une base applicative large capable d’en tirer parti.

En effet, à ce jour, les applications capables d'utiliser une telle pluralité de cores logiques sont faibles, et limitées à des domaines précis tels que l’image de synthèse ou encore le traitement de vidéos. Dans le domaine ludique par exemple, peu de jeux exploitent vraiment les 4 cores hyperthreadés d’un Bloomfield, alors ne parlons pas du Gulftown et de ses 6 cores ! D'ailleurs, si l’on exclu la problématique de fréquence et de dissipation liée à la finesse de gravure, AMD devrait plus tirer parti du passage de 4 à 6 cores avec ses Phenom II X6 prévus pour fin avril, du fait de l’absence d’Hyperthreading …


On se retrouve finalement donc dans une situation similaire à celle qui avait eu lieu lorsqu’Intel avait lancé son premier quad-core, le QX6700, en novembre 2006. Il aura fallu attendre l’arrivée du Q6600 en janvier 2007 et surtout ses baisses de prix successives pour démocratiser le quad, à une époque ou la base applicative n’était pas très grande. Intel prévoit de lancer un hexacore plus abordable, le Core i7-970, durant le courant du troisième trimestre … le futur Q6600 ? Difficile à dire, d’autant que se rajoute aux problématiques de l’époque celle de la plate-forme, les gammes Intel étant désormais scindées entre LGA1156 et LGA1366 en lieu et place de l’unique LGA775 de l’époque !


Copyright © 1997-2024 HardWare.fr. Tous droits réservés.