Intel Core i7-3960X, X79 Express et LGA 2011 Processeurs Publié le Lundi 21 Novembre 2011 par Marc Prieur URL: /articles/846-1/intel-core-i7-3960x-x79-express-lga-2011.html Page 1 - Un Sandy Bridge-E bridé Les premiers Core i7 d'Intel d'architecture Nehalem ont été introduits sur une plate-forme haut de gamme, le LGA 1366, en novembre 2008 avant de passer en septembre 2009 sur le milieu de gamme au travers du LGA 1156. Avec Sandy Bridge, Intel a pris le chemin inverse puisque ces processeurs ont d'abord fait leur apparition il y a 10 mois sur LGA 1155 avant d'arriver aujourd'hui dans une déclinaison LGA 2011 plus haut de gamme. Mieux vaut tard que jamais ? Core i7 LGA 2011 : Un Sandy Bridge-E bridéLes Core i7 LGA 2011 utilisent une nouvelle puce ayant pour nom de code Sandy Bridge-E. Taillée pour les Xeon, cette puce embarque pas moins de 8 cœurs et 20 Mo de cache L3 sur un die de 2,27 milliards de transistors. Le die est imposant avec une surface de 435mm², soit un peu plus du double de celui d'un Sandy Bridge qui intègre pourtant un IGP qui n'est pas présent cette fois. Par rapport au Sandy Bridge LGA 1155, Sandy Bridge-E LGA 2011 apporte donc : - 8 cœurs au lieu de 4 - 20 Mo de cache L3 au lieu de 8 Mo - 40 lignes PCI-Express au lieu de 16 - 4 canaux DDR3 au lieu de 2 Si la présence de 8 cœurs et de 20 Mo de L3 est alléchante, vous pouvez vous essuyer les babines puisqu'aucun Core i7 ne sera vendu dans cette configuration. Au mieux on disposera en effet de 6 cœurs et 15 Mo de cache L3, les versions 8 cœurs / 20 Mo étant réservées aux futurs Xeon E5 qui seront plus onéreux (jusqu'à 2000$ !). Intel recycle donc les dies partiellement défectueux de SNB-E, et ils seront nombreux vu sa taille gigantesque, en Core i7 LGA 2011. L'autre grosse différence, c'est bien entendu la gestion du PCI-Express qui est bien plus poussée. On dispose ainsi de 40 lignes directement gérées par les processeurs qui peuvent par exemple être utilisées de la sorte : - 2x16 et 1x8 - 1x16 et 3x8 - 1x16, 2x8 et 2x4 - 5x8 - 3x8 et 4x4 - 2x8 et 6x4 - 10x4 Avec 2 cartes graphiques l'écart n'est pas très important par rapport à la plate-forme LGA 1155, la différence entre 2x16 et 2x8 étant faible en pratique, mais au-delà le LGA 2011 tout comme le LGA 1366 ou l'AM3+ en chipset 990FX disposent d'un avantage même si l'existence de cartes mères LGA 1155 avec switch PCI-Express NVIDIA ou LucidLogix permet de compenser une grande partie les limitations inhérentes à la plate-forme. Il faut noter que si les processeurs et les cartes mères LGA 2011 ont été conçues pour le PCI Express 3.0, pour l'heure Intel se limite à indiquer que le tout est compatible PCI-Express 2.0 le temps d'obtenir les certifications nécessaires. Enfin la gestion de la DDR3 se fait désormais sur 4 canaux, ce qui a pour effet de doubler la bande passante théorique par rapport au LGA 1155 et de l'augmenter de 33% par rapport au LGA 1366. Cette mémoire peut officiellement être de type DDR3-1600 / PC3-12800, mais les ratios permettant de passer en DDR3-1866, 2133 et 2400 sont disponibles. Page 2 - X79 : Patsburg bridé, LGA 2011 X79 Express : Un Patsburg bridéCôté chipset, on retrouve sur LGA 2011 une nouvelle puce dénommée X79 Express. Destiné initialement à la plate-forme Xeon, on retrouve derrière le X79 Express une puce au nom de code de Patsburg. Dans sa déclinaison X79 Express, on retrouve exactement les mêmes fonctionnalités que sur P67 Express. Néanmoins il faut savoir qu'en fait Patsburg intègre en sus des 4 SATA 3 Gb/s et 2 SATA 6 Gb/s un contrôleur de stockage supplémentaire qui n'est pas actif sur X79. En fonction des versions de la puce, un nombre plus ou moins important de fonctionnalité de cette SCU (Storage Controller Unit) sont actives : - A : 4 SATA 6 Gb/s additionnels sur le SCUMalheureusement alors qu'initialement c'est la configuration B qui était retenue pour le X79 Express, finalement il est totalement dépourvu de la SCU. Il est difficile de savoir ce qui a empêché au final cette intégration : s'agit-il d'une volonté commerciale ou simplement d'un bug, Intel ayant alors sacrifié la SCU au profit du maintien d'une date de lancement en 2011 ? La présence sur la carte mère DX79SI (encore en préversion) qu'Intel nous a fourni par le test d'un emplacement non utilisé marqué comme "SATA 6 – 9" confirme en tout cas ce changement opéré il y a quelques mois. Un Socket LGA 2011 (pas bridé)En sus du processeur et du chipset, la plate-forme LGA 2011 accueille une dernière évolution… le Socket à proprement parler ! Comme son nom l'indique, il dispose désormais de 2011 points de contacts ! C'est 47% de plus que sur LGA 1366, une inflation liée à la gestion d'un quatrième canal mémoire et à l'intégration du contrôleur PCI-Express dans le processeur. LGA 2011, LGA 1366 et LGA 1155 : c'est gros ! Le système de fixation du processeur évolue également, puisqu'il utilise désormais deux pattes de part et d'autre du processeur. L'autre grosse évolution concerne la fixation du ventirad puisque leur système de fixation vient se visser directement sur une base métallique qui entoure le Socket, ce qui permet d'éviter de passer par un changement de plaque à l'arrière de la carte mère parfois pénible. Page 3 - La gamme Core i7 LGA 2011, Watercooling Intel La gamme Core i7 LGA 2011 Dans un premier temps, Intel lance deux processeurs sur LGA 2011 : - Core i7-3960X : 3,3 GHz (Turbo 3,9 GHz), 15 Mo de L3, 990$ - Core i7-3930K : 3,2 GHz (Turbo 3,8 GHz), 12 Mo de L3, 555$ Ces deux CPU disposent de 6 cœurs dotés de l'Hyperthreading et d'un TDP de 130 watts. Un Core i7-3820 suivra au premier trimestre 2012. Cadencé à 3.6 GHz pour un Turbo à 3.9 GHz, il ne disposera "que" de 10 Mo de L3 et de 4 cœurs avec Hyperthreading. Son coefficient multiplicateur ne sera que partiellement débloqué comme c'est le cas des Core i5/i7 LGA 1155 "non K", et son prix n'est pas encore définit. Pour ce test, Intel nous a fournit un Core i7-3960X, bien que cette version ne soit pas forcément la plus intéressante du lot vu son tarif. CPU-Z n'arrive pas à lire le vCore sur la carte mère DX79SI d'Intel, sachez que contrairement à ce qu'indiquent les screenshot le processeur demande 0,8v au repos et 1,25v en charge. L'utilisation du Turbo Boost 2.0 est plus poussée que sur les processeurs LGA 1155. Premièrement, le mode "Burst", qui permet de dépasser la limite de TDP pendant une courte durée, est portée de 1 à 10secondes. Pendant cet intervalle de temps, le processeur pourra consommer jusqu'à 156 watts. Au-delà de cette limite, il devra se contenter de ses 130 watts mais la hausse de fréquence permise est plus importante que sur LGA 1155 : - +300 MHz pour 5 à 6 cœurs utilisésSur un Core i7 LGA1155 on est à titre de comparaison à +100, +200, +300 et +400 MHz avec 4, 3, 2 et 1 cœurs utilisés. Il faut noter que ce mode Turbo Boost n'est pas forcément gage d'une plus grande efficacité énergétique pour le processeur seul. Ainsi, si l'on compare les performances et la consommation sur l'ATX12V, qui alimente exclusivement le bloc d'alimentation CPU, sous Fritz Chess Benchmark en fonction du nombre de thread on obtient du fait du Turbo Boost : - 1 thread : +18,2% en performances, +33,3% en consommation (+12 watts) Pas de ventirad box, mais un watercooling : l'Intel RTS2011LCUne grosse nouveauté de l'offre LGA 2011 c'est qu'Intel a choisi de ne pas inclure de ventirad dans les boites de ces processeurs. Deux offres de refroidissement seront proposées à part : - L'Intel Air Cooling, un ventirad classique à moins de 20$ - L'Intel Water Cooling, en water cooling tout en un à 85-100$ L'Intel Air Cooling est comparable aux ventirad box classiques, il ne permet donc pas vraiment l'overclocking ni une utilisation du processeur en charge en toute discrétion. L'Intel Water Cooling (RTS2011LC) utilise comme les systèmes Antec ou Corsair une solution mise au point par Asetek. Nous avons eu l'occasion de tester rapidement cette solution par rapport à un Noctua NH-U12P SE2 doté du kit LGA 2011. Afin de les mettre sur un pied d'égalité, nous avons utilisé dans les deux cas deux ventilateurs en push-pull, des NF-P12 et les résultats obtenus étaient similaires, à savoir 51°C de delta par rapport à la température ambiante en charge sous Prime95 lors d'un overclocking à 4.6 GHz. On pouvait s'y attendre étant donné la taille du radiateur, ce système n'est donc pas plus performant qu'un refroidissement à air classique de bonne facture. On notera toutefois que ce test hors boitier ne permet pas de mettre en évidence l'avantage de ces systèmes de watercooling qui facilitent l'évacuation de la chaleur dégagée par le CPU en dehors du boitier, le radiateur venant se fixer sur ce dernier au niveau de l'emplacement arrière du ventilateur 120mm. Nous avons par contre été désagréablement surpris par les nuisances sonores du système. Le moteur du ventilateur fournit par Intel est audible à faible rotation, mais surtout la pompe émet un bruit fort désagréable, surtout en position verticale, ce même après un long moment de fonctionnement et après avoir tapoté dessus afin d'évacuer des bulles du système. Dans un système fortement ventilé, le bruit est couvert par le souffle des ventilateurs, mais si on recherche le silence durant les périodes de repos on entendra alors un bruit qui fait penser, en moins fort, à un disque dur lors d'accès. Page 4 - Intel DX79SI, G.Skill RipjawsZ, Protocole Intel DX79SINous disposions pour ce test d'une carte mère DX79SI d'Intel architecturée autour du chipset Intel X79 Express. Elle offre 8 DIMM DDR3 pouvant accueillir jusqu'à 64 Go de mémoire et 3 slots PCI-Express x16 fonctionnant en x16/x8/x8 avec trois cartes graphiques. On notera au passage que les switchs utilisés pour faire fonctionner les deux derniers slots en x16/x0 ou x8/x8 sont des PI3PCIE3 de Pericom compatibles PCI Express 3.0. Une autre ligne PCI-Express issue du LGA 2011 est utilisée pour gérer un contrôleur USB 3.0 Renesas D720200AF1 pour deux ports à l'arrière de la carte. Les 6 lignes PCI-Express du X79 Express sont pour leur part utilisées comme suit : - 2 lignes pour 2 ports PCI-E x1 - 2 lignes pour 2 puces réseaux Gigabit (Intel 82579L et 82574L) - 1 ligne pour un second contrôleur USB 3 (2 ports internes) - 1 ligne pour un contrôleur IEEE 1394 La gestion de l'audio est confiée au codec Realtek ALC892, et du côté stockage on se limite aux fonctionnalités du X79 Express, à savoir 2 ports SATA 6G et 4 ports SATA 3G. G.Skill RipjawsZLa gestion de la mémoire sur 4 canaux devrait entrainer l'annonce de nombreux kits de mémoire quad channel chez les fabricants de mémoire. G.Skill nous a ainsi fait parvenir pour notre test un kit de 16 Go de RipjawZ fonctionnant en DDR3-1600 avec des latences de 9-9-9-24 pour une tension de 1.5v. Le testPour ce test, nous avons repris notre nouveau protocole mis au point lors du test de l'AMD FX. Rendez-vous sur cette page si vous voulez en savoir plus ! Sauf mention contraire les tests sont effectués sur les plates-formes suivantes : - ASUSTeK P5QC (LGA775) - Intel DP55KG (LGA1156) - Intel DP67BG (LGA1155) - Intel DX58SO (LGA1366) - Intel DX79SI (LGA2011) - ASUS M5A99X EVO (AM3/AM3+) - 2x4 Go DDR3-1066 7-7-7 (Q6600) - 2x4 Go DDR3-1333 7-7-7 (Q9650) - 2x4 Go DDR3-1600 9-9-9 - 3x4 Go DDR3-1600 9-9-9 (LGA 1366) - 4x4 Go DDR3-1600 9-9-9 (LGA 2011) - GeForce GTX 580 + GeForce 280.26 - SSD Intel X25-M 160 Go + SSD Intel 320 120 Go - Alimentation Corsair AX650 Gold Notez que le fait d'avoir 12 ou 16 Go de mémoire n'améliore pas les performances dans nos tests, l'intérêt étant ici seulement d'utiliser pleinement les canaux DDR3 disponibles sur les plates-formes. Page 5 - Cache & Mémoire, impact des 4 canaux Performances des cachesAvant de passer aux performances applicatives, nous avons voulu vérifier les performances des caches sous Aida64, tous les processeurs testés fonctionnant à 3.2 GHz pour ce test : Logiquement les caches L1 et L2 de Sandy Bridge-E affichent les mêmes performances que ceux de Sandy Bridge. Par rapport aux architectures précédentes, on note des débits en lecture en forte hausse mais une latence un peu moins bonne sur le L2. Le cache L3 est plus gros mais aussi moins rapide que celui de Sandy Bridge, que ce soit en termes de débit ou de latence. Par rapport à un Gulftown les débits sont par contre améliorés, ceci au détriment de la latence. Performances mémoiresOn passe maintenant aux performances du contrôleur mémoire. Toujours à 3.2 GHz, on teste différentes architectures Intel avec de la mémoire DDR3-1600, en jouant sur le nombre de canaux mémoire utilisés. Les résultats sont obtenus via Aida64 (bande passante single thread, latence) et RMMT (bande passante multithread). Il faut savoir que sur LGA 1366, soit les Bloomfield (Core i7 45nm) et les Gulftown (Core i7 32nm) le contrôleur mémoire ne fonctionne pas à la fréquence du processeur mais à une fréquence minimale liée à celle de la mémoire qui est de 3.2 GHz sur Bloomfield et 2.4 GHz sur Gulftown. Cet écart de fréquence du contrôleur mémoire explique les performances mémoires meilleures sur Bloomfield que sur Gulftown. Concernant le passage de 2 à 3 canaux, le gain en bande passante est assez faible et entraine une latence plus importante. Sur Sandy Bridge-E, les résultats avec 3 et 4 canaux sont tout autres en termes de bande passante puisque cette dernière augmente dans les deux cas de manière substantielle : +47,6% et +50% en lecture et en écriture multithread entre 2 et 3 canaux, soit un scaling quasi parfait, et +82,8% et +82,7% entre 2 et 4 canaux ! On atteint ainsi 42,5 Go /s en lecture, rien que ça ! Par rapport à Sandy Bridge, on notera que les résultats obtenus sont bizarrement inférieurs à nombre de canaux identiques, que ce soit en termes de débit ou de bande passante. Cette dernière ne bouge par contre pas entre 2 et 4 canaux, mais elle est fortement impactée en mode 3 canaux. 2, 3 et 4 canaux en pratiqueLa bande passante mémoire, c'est bien, mais est-elle pour autant utile en pratique ? Pour en avoir le cœur net nous avons testé le Core i7-3960X avec 2, 3 ou 4 canaux en DDR3-1600 CL9 sous notre protocole applicatif. On donne aux résultats obtenus avec deux canaux l'indice 100 : Dans les tests applicatifs, les plus gros gains lors du passage entre 2 et 4 canaux sont obtenus sous Lightroom et 7-zip, avec respectivement 13,7 et 9,6% de mieux. Les autres gains sont très limités. Il en va de même pour les jeux puisque si Rise Of Flight ou Anno 1404 affichent 3,9% et 3,6% de gain on reste entre 0 et 2% dans les autres tests. Le mode 3 canal offre des résultats contrastés : certaines applications et jeux tirent partie de la bande passante supplémentaire, mais certains jeux souffrent légèrement de la latence plus élevée dans ce mode. L'impact reste toutefois faible avec une perte qui ne dépasse pas les 0,6% dans le pire des cas. Le quadruple canal ne doit pas être une fin en soit, puisqu'un mode DDR3 plus élevé en double canal peu permettre d'avoir des performances plus importantes. En DDR3-2133 9-11-10 sur deux canaux, on va ainsi plus vite qu'en DDR3-1600 9-9-9 sur quatre canaux sauf sous Lightroom : Bien entendu, en DDR3-2133 sur 4 canaux on serait encore au-delà, mais étant donné que nous n'avions que 2 barrettes DDR3-2133 à disposition nous n'avons pas pu vérifier si le contrôleur mémoire supportait une telle vitesse en mode 4 canaux. Page 6 - Consommation et efficacité énergétique Consommation et efficacité énergétiqueDans nos précédents articles dédiés aux processeurs, nous mesurions la consommation en charge sous Prime95. Ce stress test a le mérite de pousser de manière assez équitable les différentes architectures dans leurs derniers retranchements, mais il nous était impossible de mettre en parallèle consommation et performance, le benchmark intégré à Prime95 consommant moins et n'étant pas aussi équilibré entre les processeurs. Nous avons donc décidé de chercher un autre logiciel offrant sur toutes les architectures un niveau de performance et de consommation représentatif de ce que nous obtenions sur les autre applications de notre protocole de test. Au final notre choix s'est porté une nouvelle fois sur sous Fritz Chess Benchmark, qui a de plus l'avantage de pouvoir facilement fixer le nombre de thread à utiliser. Les mesures de consommation ne sont donc pas à prendre comme des valeurs maximales absolues mais plutôt typique d'une charge lourde, puisque des logiciels spécialisés dans le stress processeur tels que Prime95 peuvent consommer environ 20% de plus. Toutes les fonctionnalités d'économie d'énergie, y compris celles des cartes mères comme l'EPU d'ASUS, sont activées pour ce test du moment qu'elles n'impactent pas négativement les performances : [ Prise 220V ] [ ATX12V ] Débarrassée du X58 Express, la plate-forme LGA 2011 est bien plus économe au repos que le LGA 1366, sans toutefois atteindre le niveau du LGA 1155. En charge légère (1 thread) on reste en dessous du LGA 1366 mais on s'en rapproche, tout comme en charge maximale (12 thread). Il faut noter qu'en charge la consommation à la prise grimpe de 5 watts en passant de 2x4 Go à 4x4 Go, ce qui impacte les plates-formes LGA 1366 et 2011 qui sont équipées de 3 ou 4 barrettes contre 2 pour les autres. La mesure sur l'ATX12V permet d'isoler la consommation du processeur. Les chiffres ne sont malheureusement pas exactement comparables puisque dans certains cas une petite partie de la consommation du CPU est issue de la prise ATX 24 pins standard. A défaut, on peut toutefois comparer les processeurs qui utilisent une même carte mère. On note que le Core i7-3960X est le processeur Intel qui tire le plus sur l'ATX12V en charge. Reste maintenant à représenter l'efficacité énergétique d'un processeur. Pour se faire il s'agit de diviser la performance obtenue sous Fritz Chess Benchmark par la consommation du CPU. Seul problème, il n'est pas possible de connaitre exactement celle-ci : la mesure sur l'ATX12V n'est pas 100% comparable d'une plate-forme à une autre, et la mesure à la prise ne permet pas complètement d'isoler tout ceci. Nous avons donc fait le choix d'utiliser deux méthodes de calcul pour isoler la consommation de processeur : - Consommation sur l'ATX12V - 90% du delta de consommation à la prise entre charge et repos Nous utilisons les 90% afin d'exclure le rendement de l'alimentation à proprement parler. Il faut noter que si la première mesure favorise les processeurs tirant une petite partie de leur énergie via la prise ATX classique, la seconde favorise ceux qui ont une consommation élevée au repos. Malheureusement aucune méthode n'est parfaite. [ Prise 220V ] [ ATX12V ] Le Core i7 LGA 2011 est loin d'atteindre l'efficacité énergétique d'un Core i7 LGA 1155. On est en fait à des niveaux comparables de celui d'un Core i7-990X en charge maximale, mais en dessous en charge légère. Ceci est majoritairement lié au mode Turbo Boost plus énergivore sur le 3960X. Malgré ces résultats un peu décevants, le LGA 2011 reste plus efficace que n'importe quelle autre CPU AMD. Page 7 - Overclocking Overclocking par le bus !On commence par l'overclocking du processeur, qui change un peu par rapport à celui connu sur LGA 1155. C'est en effet le grand retour de l'overclocking par le bus ! De base la vitesse DMICLK reste pourtant bloquée comme c'est le cas sur LGA 1155, à environ 105 MHz. Cette fréquence reste utilisée comme base pour les autres bus, mais Intel permet d'appliquer un coefficient multiplicateur pour la fréquence qui est utilisée par le processeur. Deux coefficients sont ainsi disponibles x1.25 et x1.67. En pratique nous n'avons pu faire fonctionner que le mode x1.25, avec une fréquence de bus maximale de 131,25 MHz (105x1,25). Le mode x1.67 n'a pas pu fonctionner, même à 150,3 MHz (90x1,67). Cette option est-elle pour autant intéressante ? Bien entendu, elle permettra d'overclocker le futur Core i7-3820, mais sur les 3930K et 3960X les coefficients multiplicateurs ne sont pas bloqués et le gain est quasi nul comme le montre ces différences obtenues à 4.5 GHz entre un réglage en 45*100 et un autre en 36*125 : - 3ds Studio Max 2011 : 0,23% - Visual Studio 2011 : 0,89% - 7-zip : 0,82% - Lightroom : 0% - Fritz Chess Benchmark : 0,19% En fait le gain provient plutôt du réglage mémoire, cette dernière étant avec un bus à 100 MHz en DDR3-1600 et avec un bus à 125 MHz en DDR3-1666. En effet de base les ratios suivants sont disponibles : - 100 MHz : DDR3-800, 1066, 1333, 1600, 1866, 2133, 2400 - 125 MHz : DDR3-1000, 1333, 1666, 2000, 2333, 2666, 3000 Vous l'aurez compris, l'overclocking par le bus n'a pas vraiment d'intérêt du point de vue des performances pratiques et son intérêt se limitera aux benchmarkeurs extrêmes qui sont intéressé par le moindre petit gain. Overclocking du CPUQuid de l'overclocking du processeur à proprement parler ? De base sous Prime95, notre processeur consomme 136,8 watts sur l'ATX12V, le monitoring interne du processeur remonté par HWMonitor indiquant une consommation de 129 watts. Avec le Turbo, le processeur fonctionnait alors à 3.6 GHz environ. Pour commencer nous avons donc essayé de savoir quelle était la tension minimale possible pour un fonctionnement à 3.6 GHz sous Prime95. Nous avons pu descendre jusqu'à 1.1v dans le bios, sans que nous sachions quelle était la tension réelle, les logiciels étant incapable de lire le vCore sur la DX79SI. La consommation est en baisse de 36w sur l'ATX12V par rapport à la configuration par défaut. On commence ensuite à tester l'overclocking par saut de 200 MHz, et on atteint 3.8 GHz à 1.15v, 4 GHz à 1.25v, 4.2 GHz à 1.3v et 4.4 GHz à 1.35v. Pour ce réglage la consommation sur l'ATX12V grimpe à 201.6 watts, soit 47,6% de plus que par défaut. On passe alors à des sauts de 100 MHz qui sont stabilisés par des hausses de tensions de 0.05v, pour s'arrêter à 4.6 GHz et 1.45v. On atteint alors les 256,8 watts sur l'ATX12V soit 87,7% de plus que la configuration initiale. Les 4.7 GHz n'étaient pas stables à 1.5v, alors que la consommation atteignant alors 290 watts. Une montée en fréquence somme toute correcte mais qui n'a rien d'exceptionnelle sur notre Core i7-3960X. Page 8 - Rendu 3D : Mental Ray et V-Ray 3d Studio Max 2011 - Mental Ray Nous passons aux tests pratiques avec pour commencer un rendu 3d sous 3d Studio Max 2011 en utilisant le moteur de rendu Mental Ray sur une scène d'Evermotion . Le rendu est effectué en 600*375 afin de garder un temps de test raisonnable. Le Core i7-3960X creuse un écart de 16,1% par rapport au Core i7-990X sous ce premier test. Il est 41,2% plus véloce qu'un Core i7-2600K. 3d Studio Max 2011 - V-Ray 2.0 Toujours sous 3d Studio Max 2011, on change de moteur pour le moteur tiers le plus populaire, V-Ray 2. On utilise une autre version de la même scène préparée par Evermotion pour ce moteur, le rendu étant toujours effectué en 600*375. Les temps de rendu sont nettement plus rapides, toutefois il ne s'agit pas de comparer les moteurs entre eux puisqu'il faudrait également observer de manière très attentive la qualité des fichiers finaux. Si le gain est moindre face au 990X avec "seulement" 14,3%, on reste 41,3% plus rapide qu'un 2600K du fait de la présence de 6 cœurs. Page 9 - Compilation : Visual Studio et MinGW/GCC Visual Studio 2010 SP1 Nous compilons sous Visual Studio 2010 SP1 le code source du moteur 3D Ogre. Sous Visual Studio le 3960X est 11,8% plus rapide qu'un 990X, et 41,9% plus rapide qu'un 2600K. MinGW / GCC 4.5.2 Le même code source est cette fois compilé sous MinGW / GCC 4.5.2. Cette fois l'écart est moins impressionnant avec 9,5% de mieux que le 990X et 34,8% de mieux que le 2600K. Page 10 - Compression : 7-zip et WinRAR 7-zip 9.2 7-zip rejoint notre protocole de test. Contrairement à WinRAR ce logiciel est fortement multithreadé si on utilise son algorithme le plus performant, LZMA2. Nous mesurons le temps nécessaire pour compresser un volume important de fichiers. L'important cache L3 combiné à la mémoire sur 4 canaux permet au 3960X de creuser un écart record par rapport au 2600K puisqu'il est 62,4% plus rapide ! Le gain face au 990X est toutefois plus limité puisque de seulement 7,4%. WinRAR 4.01 Les mêmes fichiers sont compressés sous WinRAR en utilisant l'algorithme RAR le plus poussé ("Best"). WinRAR ne tire malheureusement pas vraiment parti de plus de 2 cœurs, du coup le 2600K n'est devancé que de 12,7% par son grand frère. Le 990X est pour sa part plus éloigné, le passage au LGA 2011 apportant un gain de 22,7%. Page 11 - Encodage : x264 et MainConcept H.264 StaxRip - x264 build 2085 Pour l'encodage vidéo nous avons conservé le célèbre x264, ici dans sa build 2085. Nous utilisons l'interface StaxRip pour transcoder un extrait 1080p tiré du Blu-ray du film Avatar en utilisant 2 passes en mode fast avec un bitrate de 10 Mbits /s. Les temps des deux passes sont reportés, la 1ère étant moins multithreadée que la seconde et ne profitant pas de vraiment de plus de 3 à 4 cœurs. [ Total ] [ 1ère passe ] [ 2nde passe ] Avec 8,3% de gain face au Core i7-990X, l'écart creusé par l'i7-3960X reste faible. Il est de 22,8% face au 2600K, le gain de 38,5% sous la seconde passe étant compensé par seulement 0,8% de gain au cours de la première qui est bien moins multithreadée. MainConcept Reference 2.2 H264 Pro On passe maintenant à un autre codec H.264, celui de MainConcept. Nous utilisons l'interface MainConcept Reference H.264 pour effectuer le même type de transcodage que sous x264. Il faut noter que la 1ère passe est mieux multithreadée et nous ne reportons cette fois que le score global. Face à l'i7-990X, le 3960X fait 5,5% de mieux seulement. Il est par contre 27,1% plus rapide que le 2600K. Page 12 - Traitement photo : Lightroom et Bibble Adobe Lightroom 3.4 Le traitement des photos par lot fait son apparition au sein de notre protocole. On commence par Lightroom au sein duquel nous exportons en JPEG un lot de 96 photos RAW issues d'un 5D Mark II tout en leur appliquant divers effets, tels que des corrections colorimétriques, d'objectif ou encore le traitement du bruit. Comme nous l'avons vu précédemment, Lightroom profite pleinement du surplus de bande passante offert par le LGA 2011. Le 3960X parvient du coup à être 25,6% plus rapide que l'i7-990X, l'écart par rapport au 2600K étant de 35,6%. Bibble 5.2.2 Sous Bibble nous traitons un lot de 48 photos RAW. Vous noterez que Bibble est plus lent que Lightroom, mais comme pour les moteurs de rendu ce test n'est pas là pour comparer les logiciels entre eux d'autant qu'il faudrait alors comparer minutieusement la qualité des sorties : un export plus lent peut aussi être plus qualitatif. Sous Bibble l'écart entre LGA 1366 et LGA 2011 est plus faible avec un avantage de 10,7% pour le nouveau venu. Les six cœurs sont par contre très bien mis à profit et les photos sont traitées 53,4% plus rapidement que sur 2600K. Page 13 - IA d'échecs : Houdini et Fritz Houdini 2.0 Pro Enfin nous terminons ce tour d'horizon applicatif par un type d'application assez particulier, à savoir des algorithmes d'intelligence artificielle destinée aux échecs. On commence par Houdini Pro 2, utilisé via l'interface Arena 3. La version 1.5 trustait les 1ères places des classements des moteurs d'échecs et la version 2 semble promise au même avenir. Nous laissons tourner le moteur jusqu'au 24è tour en début de partie et notons la vitesse exprimée en Kilonoeuds par secondes. Houdini n'est pas vraiment friand de l'architecture Sandy Bridge et on note un léger recul des performances (-0,7%) des performances par rapport au Core i7-990X, un score qui fait heureusement figure d'exception. Les six cœurs sont par contre très bien exploité et on gagne 44,3% face au 2600K. Fritz Chess Benchmark 4.3 Nous passons maintenant à Fritz Chess Benchmarking, de l'éditeur Chess Base. Là encore les chiffres sont exprimés en Kilonoeuds par secondes. Ce moteur d'échec ne tire pas non plus beaucoup de gain de l'architecture Sandy Bridge mais cette fois on observe un petit gain de 2,4%. Par rapport au 2600K les performances sont en hausse de 47%. Page 14 - Jeux 3D : Crysis 2 et Arma II : OA Crysis 2 v1.9 Crysis 2 inaugure la partie jeux 3D de ce comparatif. Nous utilisions la dernière version 1.9 en DirectX 11 et mesurons le framerate obtenu en 1920*1080 Ultra à un emplacement précis au cours d'une fusillade. Comme quasiment tous les jeux, Crysis 2 tire tout juste profit de 4 cœurs et semble de plus être limité par le GPU à environ 50 fps sous notre scène de test. Les processeurs Intel les plus haut de gamme se tiennent dans un mouchoir de poche et il n'est pas vraiment possible de les partager ici. Arma II : Operation Arrowhead v1.59 Sous Arma II : Operation Arrowhead nous mesurons le framerate lors de la traversée d'un village lors de la première mission solo, toujours en 1920*1080 et toutes options poussées au maximum, y compris la distance de visibilité. Sous Arma II nous ne sommes cette fois pas GPU limited, et le Core i7-3960X est 4,5% plus véloce que le 990X. Il reste cependant légèrement moins rapide qu'un Core i7-2600K, l'écart n'étant toutefois que de 1% ce qui n'est pas très significatif. Page 15 - Jeux 3D : Rise of Flight et F1 2011 Rise Of Flight v1.021b Rise Of Flight, simulateur d'avions de chasses de la 1ère guerre mondiale, est utilisé en 1920*1080 avec un niveau de détail élevé. Pour ce test nous lançons une mission personnalisée avec un combat de 32 contre 32 appareils, le framerate étant mesuré en vue arrière sur nos 31 acolytes. Avec 15,1% de mieux qu'un 990X, l'i7-3960X donne cette fois du fil à retordre à son prédécesseur. On obtient même un gain de 6,7% par rapport au 2600K. F1 2011 Le tout nouveau F1 2011 est utilisé en 1920*1080 avec les détails poussés au maximum. Nous mesurons le framerate durant le départ du GP de Monaco. F1 2011 est également à l'avantage du LGA 2011 avec 7,3% de mieux par rapport au 990X et au 2600K. Page 16 - Jeux 3D : Total War Shogun 2, Starcraft II et Anno 1404 Total War : Shogun 2 Pour Total War : Shogun 2 nous utilisons l'immense bataille du test "DX9 CPU" modifiée pour utiliser DX11 en 1920*1080 avec un niveau de détail élevé. Sous Shogun 2 l'i7-3960X est 17,9% plus rapide que l'i7-990X, et 3,6% plus rapide que le 2600K. Nous n'avons malheureusement pas de score à vous fournir pour les AMD FX pour ce jeu. En effet, sur ce processeur le jeu plante au démarrage, bug que nous avons remonté à AMD et qui existe également sous d'autres jeux utilisant la protection CEG de Steam tels que Deux Ex : Human Revolution. AMD est au courant du problème et travail sur un correctif qui n'est pas encore disponible. Starcraft II v1.3.6 Sous Starcraft II, nous utilisons un replay spécialement enregistré par des utilisateurs du forum que nous remercions. Ce replay contient une attaque très (très) importante et nous mesurons le framerate durant cette dernière en 1920*1080 avec les détails poussés au maximum. Les machines sont mises à genoux par ce test qui est en pratique encore plus extrême que celui effectué sous Shogun 2. Il permet au Core i7-3960X d'afficher un gain de 16,5% par rapport à son prédécesseur, cependant la perte est de 1,9% face au 2600K. Anno 1404 v1.3 Enfin pour Anno 1404 nous chargeons une sauvegarde d'une cité de 46 600 habitants que nous visualisons depuis une vue éloignée, le tout en 1920*1080 détails poussés au maximum. Enfin sous Anno 1404 on observe un gain de 13,7% en passant du 990X au 3960K, les performances étant par ailleurs en hausse de 5,7% par rapport au 2600K. Page 17 - Moyennes MoyennesBien que les résultats de chaque application aient tous un intérêt, nous avons calculé des indices de performances en se basant sur l'ensemble de résultats et en donnant le même poids à chacun des tests. Pour la première fois, nous intégrons en fait deux moyennes, l'une applicative intègre tous les tests en dehors des jeux 3D et l'autre est spécifique aux jeux 3D (exclusion faite de Shogun 2 vu son score nul sur AMD FX). [ Standard ] [ Par performance ] Le Core i7-3960X ne fait qu'accentuer l'avance déjà obtenue par le 990X dans les tests applicatifs, qui tirent quasiment tous partie des 6 cœurs hyperthreadés du processeur. Ces deux processeurs sont sans véritable concurrence, mais le gain offert par la nouvelle plate-forme reste limité puisque de seulement 10,4%. Sachant que le 990X est environ 3% plus rapide que le 980X sorti en mars 2010, le gain de performances après un an et demi et un changement de plate-forme est décevant. Il faut dire que contrairement à ce qui s'est passé sur les Core i7 LGA 1155 face au Core i7 LGA 1156, on reste ici à une finesse de gravure équivalente de 32nm ce qui limite d'office les gains pour une même enveloppe thermique. [ Standard ] [ Par performance ] Les jeux ne profitent pas vraiment de la présence de 6 cœurs. Si l'i7-3960X offre un gain de 9,9% par rapport au 990X, il n'est que 2,9% plus rapide qu'un i7-2600K et on peut penser qu'un i7-2700K serait quasiment au même niveau. Bien que la fréquence du 990X soit légèrement supérieure via le mode Turbo, les gains liés à la présence de 4 canaux ou à la taille du cache L3 semblent totalement annulés par la latence légèrement supérieure des accès mémoire et L3 ainsi que la bande passante mémoire inférieure pour un thread. Page 18 - Conclusion ConclusionAvec le Core i7-3960X, Intel enfonce le clou et offre de nouveau le processeur desktop le plus rapide du moment. Pour peu que l'on exploite correctement les 6 cœurs qui sont à notre disposition ce processeur ne souffre en effet d'aucune concurrence et il affiche par ailleurs une excellente gestion de la DDR3 avec jusqu'à 64 Go sur 4 canaux ce qui lui permet d'atteindre des débits d'un niveau inédit. Bien sûr, il est également hors de prix puisqu'annoncé à 990$, mais le 3930K qui est seulement 3-4% moins véloce est à 550$ ce qui est déjà plus raisonnable. Bien entendu toutes les applications ne sont pas capables de tirer parti d'une telle débauche de cœurs. Comme d'habitude les applications de création seront les plus à même de le faire, alors que les jeux tirent à peine partie de 4 cœurs. Dès lors pour une utilisation purement gaming les Core i7 LGA 2011 n'offrent pas vraiment d'avantage face aux Core i7 et i5 LGA 1155 si ce n'est au travers de leur plate-forme plus adaptée pour les configurations multi-GPU, notamment en Tri-SLI / triple CrossFireX. Un avantage somme toute modeste puisqu'il existe des cartes LGA 1155 utilisant des switch PCI-Express NVIDIA ou LucidLogix qui compensent une bonne partie des limitations inhérentes à la plate-forme. Le très bon niveau de performances atteint ne doit toutefois pas masquer quelques déceptions. La première, c'est le gain qui est somme toute limité (environ 15%) par rapport aux Core-i7 six cœurs, les Gulftown, qui ont fait leur apparition il y a pourtant déjà 18 mois. Il faut dire qu'avec une gravure en 32nm de part et d'autre, Intel ne pouvait donc s'appuyer que sur les avancées côté architectural (Sandy Bridge) ou plate-forme (4 canaux DDR3) à enveloppe thermique équivalente. Côté plate-forme on notera d'ailleurs la simplification opérée face au LGA 1366 avec l'intégration au sein du CPU du northbridge ce qui a un impact non négligeable sur la consommation au repos. La seconde déception est liée à cette problématique d'enveloppe thermique puisque Intel s'est finalement contenté du minimum syndical. Sandy Bridge-E dispose en effet de 8 cœurs, mais seuls 6 sont actifs sur Core i7 afin de conserver un TDP de 135 watts avec de bonnes fréquences, les 8 cœurs étant réservés aux Xeon E5 qui seront plus onéreux. A 990$ le processeur, on aurait pu s'attendre à une version vraiment Extreme, c'est-à-dire avec 8 cœurs actifs quitte à ce que le TDP soit de 165 watts ! La plate-forme X79 Express souffre également d'un bridage du même type, même si il est possible que celui-ci soit cette fois ci lié à un bug de dernière minute plus qu'a une énième volonté de segmentation de la part du géant de Santa Clara. Alors qu'il était initialement prévu que le X79 Express gère 4 SATA 3G, 2 SATA 6G et 4 SAS/SATA 6G, ce dernier se retrouve finalement au niveau d'un H67/P67/Z68 Express LGA 1155, à savoir avec 4 SATA 3G et 2 SATA 6G. Bien entendu, c'est suffisant pour la très grande majorité des utilisateurs mais étant donné le positionnement très haut de gamme de la plate-forme, avec des cartes mères débutant à 200 € et pouvant atteindre les 350 €, Intel a perdu l'occasion de creuser l'écart face au LGA 1155. Vous l'aurez compris, cette nouvelle plate-forme nous laisse sur notre faim. Sans réelle concurrence de la part d'AMD dans cette gamme, Intel est loin d'avoir poussé le concept du LGA 2011 dans ces derniers retranchements. Il s'agit malgré tout de la solution la plus performante, et de loin, si vous tombez dans son domaine de prédilection, à savoir des applications fortement multithreadées ou à défaut un multitâche intensif. Dans le cas contraire, le LGA 1155 n'aura pas à rougir et il offre dans tous les cas un rapport performance / prix et une efficacité énergétique supérieurs. Reste une dernière inconnue concernant le LGA 2011, c'est son évolutivité. Sera-t-il un minimum pérenne comme le fut le LGA 1366, ou s'agit-il d'un nouveau Socket à la durée de vie courte comme le tristement célèbre LGA 1156 ? Si les cartes mères LGA 1155 actuelles accepteront les futurs processeurs Ivy Bridge 22nm quatre cœurs, rien n'est encore sûr concernant d'éventuels Ivy Bridge-E 22nm qui seraient compatibles avec les cartes mères LGA 2011. Si tel était le cas, on peut s'attendre à ce que la baisse de consommation lié au 22nm permette cette fois à Intel de lancer son premier processeur 8 cœurs sur la gamme Core i7 ! Copyright © 1997-2024 HardWare.fr. Tous droits réservés. |