Intel Haswell-E, LGA 2011-v3 et DDR4 : Core i7-5960X, 5930K et 5820K

Publié le 29/08/2014 par
Imprimer
Les kits G.Skill et Corsair
Pour ce test, Corsair comme G.Skill on pu nous fournir des kits mémoires 4x4 Go.


Chez Corsair, il s'agit d'un kit Vengeance LPX 16 Go (4x4 Go) DDR4-2666 fonctionnant avec des latences de 15-17-17-35 à une tension de 1.2V. Ce kit est décliné avec des radiateurs noir, rouge, blanc ou bleu. En pratique nous avons mesuré que les latences de 15-17-17-35 étaient équivalentes en termes de performances à un 16-16-16-39. A noter qu'un second profil DDR4-2800 16-17-17-37 à 1.35V est intégré dans ces barrettes.

Point de vue format, on note plusieurs différences par rapport à la DDR3 : le détrompeur central revient un peu vers le centre, ce qui empêche à moins d'utiliser un marteau l'insertion dans un slot destiné à une ancienne norme mémoire, et le nombre de contacts passe de 240 à 288 afin d'accueillir le jeu de commande plus complexe de la DDR4. Ces contacts sont plus denses afin de conserver la même longueur de barrette. Enfin le bas de la barrette n'est plus horizontal mais a une forme d'arrondi qui est censé faciliter l'insertion et éviter la casse en cas d'insertion manquant de délicatesse.


Les Ripjaws 4 de G.Skill sont pour leur part un kit très haut de gamme puisqu'il s'agit toujours de 16 Go en 4x4 Go mais spécifiées cette fois en DDR4-3000 avec des latences de 15-15-15-35, soit des latences inférieures au kit Corsair alors que la fréquence est supérieure. Pour atteindre un tel niveau G.Skill a toutefois dû pousser la tension qui passe cette fois à 1.35V. En pratique en charge nous n'avons pas noté d'échauffement particulier malgré cette tension en hausse.

Au passage il faut noter que jusqu'à un bios numéroté 4601 fournit par ASUS avant-hier, la DDR4-3000 n'était pas correctement exploitée par la X99-Deluxe. En effet le bios utilisait un timing tCCD à 6, ce qui entraînait en pratique une bande passante équivalente à de la DDR4-2000 ! Avec le dernier bios par contre le timing tCCD était bien à 4. Le tCDD_L était lui à 6, ce qui va de base au delà des spécifications JEDEC.
Comparer DDR3 et DDR4, pas si facile
Lors de l'arrivée de la DDR2 ou de la DDR3, la comparaison entre les technologies mémoire était facilitée car la nouvelle venue n'était pas accompagnée de nouveaux processeurs. Avec la DDR4, c'est différent puisque les Haswell-E ne supportant pas la DDR3, il n'est pas possible de faire une comparaison en ne jouant que sur la mémoire.

Pour commencer il a fallu trouver des processeurs les plus proches possibles, c'est pour cette raison que nous avons utilisé un i7-5930K et un i7-4960X, tous deux étant dotés de 6 cœurs et 15 Mo de cache. Nous les avons cadencés à 3.5 GHz pour les cœurs ainsi qu'à 3.5 GHz pour l'Uncore sur l'i7-5930K, ce dernier étant pour rappel sous cadencé par défaut sur Haswell-E. Augmenter la fréquence de l'Uncore permet d'accélérer la vitesse du contrôleur mémoire comme celle du cache L3, ainsi entre 3 et 3.5 GHz on gagne 6-8% de bande passante et la latence baisse de 15.7 à 14.9ns, mais elle reste toutefois supérieure à celle mesurée sur Ivy Bridge-E (12.6ns). Pour information le gain de performance enregistré sous 7-Zip du fait de cette hausse de l'Uncore est de 2%.

Pour les tests nous avons utilisés AIDA64 pour la bande passante mémoire et la latence, ainsi que 7-zip pour un test plus pratique. En sus d'être assez sensible à la mémoire, 7-zip à l'avantage de ne pas tirer beaucoup profit de l'architecture Haswell ce qui permet d'éviter un biais supplémentaire dans la comparaison.

On commence par un tableau de performance général. Le résultat 7-zip est exprimé en secondes, les bandes passantes en lecture et en écriture en Go /s et la latence en nanosecondes.


Concernant la DDR3, on note que sur la plate-forme LGA 2011 le mode DDR3-2400 n'est pas avantageux, du fait entre autre de latences moins bonnes et de performances en écritures très basses.

Pour ce qui est de la DDR4 sur LGA 2011-3, les performances offertes par le mode "classique", à savoir de la DDR4-2133 que l'on trouvera généralement avec des latences de 15-15-15-35, sont en net recul face à la DDR3-1600 9-9-9-24. En effet la latence mesurée est logiquement en forte hausse, et en pratique sous 7-zip c'est la DDR3 qui l'emporte avec un avantage de plus de 4% ! Utiliser des latences plus basses, toujours en DDR4-2133, permet de prendre les devants sur la DDR3-1600 mais la DDR3-2133 est pour sa part hors d'atteinte. On notera d'ailleurs qu'en DDR3-2133 avec les mêmes timings principaux, la DDR3 est devant dans tous les secteurs !

La DDR3-2133 10-10-10-28 est en fait intouchable sauf pour les DDR4 les plus performantes, à savoir de la DDR4-3000 15-15-15-35, et pas dans n'importe quelles conditions puisqu'il faut pour obtenir les meilleures performances non pas utiliser une fréquence de base (BCLK) de 100 MHz mais plutôt une fréquence de 125 MHz, ce qui est d'ailleurs le cas par défaut avec la X99 Deluxe et le kit G.Skill Ripjaws 4 (on abaisse alors les coefficients pour avoir la même fréquence finale). On ne sait pas exactement d'où vient cet écart, cette fréquence n'étant normalement utilisée que comme base pour les autres, peut-être que le contrôleur mémoire d'Haswell-E est plus efficace avec certains ratios BLCK:DRAM qu'avec d'autres.

Sous 7-zip on enregistre un gain de 12,5% à même BCLK entre de la DDR4 "classique", et de la DDR4 très haut de gamme, contre 8,4% entre de la DDR3-1600 CL9 et de la DDR3-2133 CL10. Pour rappel toutefois 7-zip est très dépendant de la vitesse de la mémoire, mais certaines applications, notamment les jeux lorsqu'ils ne sont pas limités par le GPU, sont assez friands d'une mémoire rapide, avec des écarts qui sont environ de moitié par rapport à ceux-ci.

Si les latences obtenues ne sont guère étonnantes au vue des timings affichés de la DDR4, l'absence de hausse côté bande passante l'est plus. Afin de savoir d'où venait le problème, nous avons effectué quelques tests comparant la bande passante obtenue en double canal et en quadruple canal :


On est clairement confronté à un mur en terme de bande passante mémoire en quadruple canal, les gains inhérents à la fréquence de la DDR4 qui sont visibles en lecture double canal étant annihilés en quadruple canal. En DDR4-3000, la bande passante n'augmente que par un facteur de 1.24x à 1.29x en doublant les canaux, contre 1.88x en DDR3-1600 ! En écriture cette fois la hausse est parfaite, mais même en double canal la limitation est plus basse. On notera que fait d'utiliser un BLCK 125 MHz permet d'augmenter la bande passante en écriture même en double canal.

D'où peut venir la limitation ? C'est ce que nous avons essayé de voir en jouant sur 2 paramètres en DDR4-3000 : la vitesse du BCLK et la vitesse de l'Uncore, qui s'applique pour rappel entre autre au contrôleur mémoire et au cache L3.


Avec un Uncore à 3 GHz comme c'est le cas par défaut, la vitesse du BLCK n'a que peu d'importance. Passer l'Uncore à 3.5 GHz permet d'augmenter notablement les débits, un gain qui peut encore être accru en utilisant de manière conjointe un BLCK de 125 MHz. Enfin utiliser un Uncore à 4 GHz permet encore de gagner en bande passante, avec près de 16% et 32% de gain en lecture et en écriture par rapport au réglage de base.


Au final l'avantage de la DDR4 en terme de bande passante est complètement bridé en quadruple canal par le contrôleur mémoire des processeurs Haswell-E, ce qui peut se voir en pratique sous 7-zip avec des gains plus importants lors du passage de 2 à 4 barrettes en DDR3 qu'en DDR4. Il faut de plus atteindre des fréquences élevées pour revenir à une latence correcte, ce qui fait qu'au final la DDR4 n'apparaît pas sous son meilleur jour à son lancement … ce qui était il faut bien le dire également le cas de la DDR2 et de la DDR3 à leurs lancements respectifs ! En pratique les DDR4 les plus rapides étant chères, ce qui est certes tout relatif vu le prix de 5960X, nous vous conseillons à minima d'éviter les DDR4-2133 CL15 ou CL16.
Vos réactions

Top articles