HardWare.fr


Influence de la DDR4 sur Ryzen 7 1800X et Core i7-6900K
Processeurs
Publié le Dimanche 2 Avril 2017 par Guillaume Louel

URL: /articles/958-1/influence-ddr4-ryzen-7-1800x-core-i7-6900k.html


Page 1 - Une mémoire plus influente que d'habitude ?

Lors de notre dossier consacré à Ryzen nous avions noté certains particularités au niveau de son sous-système qui ne sont pas sans influence sur les performances.

Si côté mémoire nous avions noté une latence plus élevée qu'à l'habitude, la séparation des coeurs et du L3 en deux CCX interconnectés par un data fabric faisant également office de lien avec le reste du processeur (PCIe, DDR4) semblait également avoir un impact.

La fréquence du data fabric étant indexée sur celle de la mémoire (1200 MHz pour de la DDR4-2400 par exemple) fait qu'on peut se demander si augmenter celle-ci n'apporte pas plus de gains qu'à l'habitude : c'est ce que nous avons souhaité mesurer dans ce dossier où nous allons comparer l'influence de la mémoire sur un Ryzen 7 1800X, mais également sur un Core i7-6900K afin d'avoir un point de comparaison.

G.Skill Flare X DDR4-3200

Pour réaliser nos tests G.Skill nous a fourni un kit Flare X 2x8Go en DDR4-3200 CL14. Il s'agit de mémoire Single Ranked. Ce kit fonctionne sans problème aux timings annoncés sur notre carte mère de test, une ASUS Crosshair VI Hero.

Pour rappel, DDR4-3200 est le maximum que l'on peut atteindre sur Ryzen actuellement avec les coefficients multiplicateurs mémoire disponibles. Il est possible d'aller au-delà en modifiant la refCLK du processeur, mais cela à une incidence sur d'autres fréquences comme le PCIe sur la majorité des cartes mères : seuls les modèles les plus hauts de gamme ont un générateur d'horloge séparé. AMD a indiqué qu'il proposerait peut-être d'autres multiplicateurs dans une future mise à jour de ses AGESA/microcode, reste à voir si ce sera le cas pour la version prévue en mai.

Comme nous le rappellerons en avant-dernière page, le support de la mémoire est plus complexe qu'à l'habitude sur Ryzen, dépendant encore beaucoup des cartes mères et de leurs BIOS, ainsi que du type de mémoire utilisé.

Pour réaliser ce test, nous utilisons les mêmes configurations que pour nos tests, vous pourrez retrouver plus de détails sur ces dernières ici.

Page 2 - Latence et bande passante

Avant de mesurer l'impact de la vitesse mémoire pratique, nous avons voulu voir ce qui se passait dans des tests synthétiques. Dans le cas du Core i7-6900K, nous avons effectué les tests à la fois en mode double canal (DC sur les graphiques), et en mode quadruple canal (QC).

Ces mesures sont réalisées avec le kit G.Skill 2 x 8 Go Single Ranked en double canal, nous utilisons un kit Ripjaws V 4 x 4 Go Single Ranked du même constructeur (F4-3200C16Q-16GVK) pour les mesures en quadruple canal sur le Core i7.

Nous allons faire varier les latences, de 16-16-16-36 à 12-12-12-32, puis la vitesse, de DDR4-2133 à DDR4-3200.

Latences

Nous mesurons la latence via le logiciel Aida64, dans sa dernière version. Le support de Ryzen reste complexe encore aujourd'hui pour les différents logiciels, y compris pour le benchmark "Cache & mémoire" intégré à Aida64 qui donne parfois des résultats variables. Afin de vous donner les résultats les plus justes possibles, nous mesurons la latence pour Ryzen via son benchmark de latence avancé, plus stable.


Nous avions déjà noté l'écart important entre Ryzen et les autres plateformes sur la mémoire. On note ainsi un écart d'environ 24 nanosecondes entre la Ryzen et Core i7 en DDR4-2400, et ce indépendamment de la latence utilisée. Abaisser les latences apporte les mêmes gains sur les deux plateformes, ce qui est logique.

La future mise à jour promise par AMD qui réduirait de 6 nanosecondes la latence serait donc bienvenue, même si elle ne comblera pas tout l'écart ! On notera pour le détail que le quadruple canal est très légèrement plus rapide que le double canal sur le 6900K.

Bande passante

Si la latence est le point faible de Ryzen, quid de la bande passante ?


[ Lecture ] [ Ecriture ] [ Copie ]

Ryzen n'a pas à rougir de ce côté avec des gains assez linéaires que ce soit en lecture, écriture ou copie.

On notera au contraire des effets de paliers chez Intel où les gains se tassent assez nettement en lecture passé le mode DDR4-2933. Les performances en écriture sur deux canaux sont même très en retrait sur le Core i7-6900K par rapport à Ryzen.

Impact de la vitesse sur la latence effective

Les latences mémoires sont pour rappel exprimée en cycles d'horloge. Augmenter la fréquence mémoire (ce que l'on fait quand on passe d'un mode à l'autre) diminuera donc la latence effective, même si l'on conserve les même latences exprimées en cycles. Regardons ce qui se passe sur nos plateformes :


Ces résultats peuvent paraître surprenants à première vue. Passer d'un mode à l'autre réduit de manière plus significative la latence sur Ryzen ! Là où nous mesurions 23.7ns d'écart entre Ryzen et le Core i7 en DDR4-2400, on tombe à 18.6ns en DDR4-3200. On notera aussi qu'en DDR4-2133, on frôle un écart de 28ns !

Si l'on se rappelle du fonctionnement interne de Ryzen, on peut commencer à voir une explication. Les CCX (les blocs de coeurs) sont reliés aux contrôleurs mémoires par une data fabric dont la fréquence est indexée sur celle de la mémoire. En DDR4-2400, la data fabric est cadencée à 1200 MHz, tandis qu'en DDR4-3200 elle tourne à 1600 MHz. De quoi avoir un "double" impact sur la latence en quelque sorte.

Voyons maintenant ce qui se passe en pratique.

Page 3 - Applications : 7-Zip et WinRAR

Pour ce test, nous utilisons une sélection d'applications de notre protocole CPU. Nous avons choisis deux applications très sensibles à la mémoire, 7-Zip et WinRAR afin de voir les cas les plus extrêmes. Nous ajoutons une application plus typique avec Visual Studio, et enfin une application qui profite historiquement peu de la mémoire : x264.

Dernier rappel : les tests sont réalisés ici avec deux barrettes mémoires Single Ranked pour les configurations en double canal. Vous ne pourrez pas comparer directement ces résultats à ceux de tests de Ryzen (réalisés avec quatre barrettes Single Ranked). Nous reviendrons sur cette question à la fin de l'article.

Notez enfin que nous ajoutons dans les graphiques les performances obtenues avec les timings de référence de la mémoire G.Skill que nous utilisons pour le Ryzen 7 1800X.

7-Zip 16.04

Nous compressons un répertoire d'Arma II (un peu plus de 3.5 Go) avec le logiciel de compression 7-Zip et son algorithme de compression le plus performant, LZMA2 en mode maximal (9).


7-Zip est très sensible à la mémoire. La plateforme Core i7-6900K double canal, la plus limitée, est celle qui profite le plus avec un gain de 21.3% entre les modes DDR4-2133 et DDR4-3200. Le Ryzen 7 1800X ne gagne "que" 18% dans ce test à titre de comparaison, ce qui est plus proche du Core i7-6900K sur quatre canaux (17%).


Si l'on regarde l'influence d'un changement sur les latences seuls, on voit des gains de 5 à 6% pour le 1800X et le 6900K en quadruple canal. Le gain est un peu plus élevé pour le 6900K en double canal, 9.5%.

WinRAR 5.40

Nous compressons toujours un répertoire d'Arma II, mais ce dernier est un peu plus gros (7.5 Go, il inclut des extensions). Nous jouons sur la quantité de fichiers pour obtenir des temps de benchmarks satisfaisants, il ne s'agit en aucun cas de comparer directement les deux logiciels (une comparaison de la taille des fichiers obtenus s'imposerait). Nous utilisons le mode de compression Ultra qui tire parti du multithreading.


Si l'on met de côté les performances en retrait en DDR4-2133 sur Ryzen (on peut imaginer que ce mode est le plus limité par les choix techniques d'AMD, on l'a vu dans les tests théoriques), on note 8, 9 et 10% de gains respectivement pour le 1800X et le 6900K en double et quadruple canal entre DDR4-2400 et DDR4-3200.


Le gain entre CL16 et CL12 est autour de 4% sur les trois configurations, le Ryzen 7 gagnant le moins du lot.

Page 4 - Applications : VS 2015 et x264

# Visual Studio 2015 Update 3

Nous compilons les bibliothèques C++ Boost avec le compilateur de Visual Studio 2015 Update 3 en édition Community.


Le cas de Visual Studio est particulièrement intéressant : on note ici des gains assez nets sur Ryzen, plus de 8% lorsque l'on voit un peu plus d'un pourcent de différence sur les configurations Intel. Le gain supplémentaire sur la latence que nous avions noté dans les tests théoriques, ou l'augmentation de la bande passante du data fabric sont deux pistes possibles pour expliquer la différence.

Regardons ce qui se passe lorsque la latence évolue :


Les gains sont assez modestes, mais plus élevés sur la nouvelle plateforme d'AMD (environ 2.8% entre CL16 et CL12, à peine 1% en face).

x264 r2744

Nous encodons un extrait de Blu-Ray (1080p) d'une minute environ ayant un débit moyen de 23 Mbps. La version de x264 (64 bits) utilisée est compilée par komisar avec GCC 4.9.2.

Nous utilisons le preset slower sur un encodage mode CRF (facteur 20). Une version récente de FFmpeg officie comme serveur d'image.


On notera qu'on gagne un tout petit peu plus sur Ryzen, 1.3% contre moins d'un pourcent sur les Core i7. Un écart bien minime, x264 ne profite quasiment pas en pratique d'un gain de bande passante supplémentaire.


Réduire la latence ne change pas non plus grand chose, on est sous le pourcent de différence.

Page 5 - Jeux : Battlefield 1 et Project Cars

Nous avons sélectionné quatre jeux de notre protocole de test afin de regarder l'impact de la mémoire.

Battlefield 1

Ce dernier opus dans la série des Battlefield utilise le moteur Frostbite 3 de Dice. Si ce moteur dispose d'un mode DX12, là encore il est moins performant sur notre GeForce GTX 1080, nous testons donc en DX11. Malgré tout, le Frostbite 3 est très multithreadé. Nous mesurons les performances sur un déplacement prédéfini dans une zone particulièrement gourmande. Le jeu est réglé en mode Ultra, nous réglons le FOV au maximum (105°). Pour éviter la limite GPU, nous désactivons le HBAO et réglons l'éclairage sur élevé, et nous passons le post-traitement en mode normal.


On note des gains plus nets sur la plateforme Ryzen. En pratique l'écart entre DDR4-2133 et DDR4-3200 est de 15% environ sur Ryzen, soit le double du Core i7 en quadruple canal. En double canal, le gain est de 10% dans pour le 6900K.


Jouer sur la latence à un impact similaire sur les trois configurations, autour de 4% une fois de plus.

Project Cars

Nous passons aux performances sous l'excellent Project Cars dans sa version 64 bits. Nous mesurons les performances sur 20 secondes lors d'un départ sur le circuit "California Highway Etape 1" dans une course de GT3. Le jeu est réglé en mode Ultra avec l'anti-aliasing désactivé.


A l'image de ce que l'on a vu dans Battlefield 1, Project Cars profite lui aussi plus significativement de mémoire rapide, avec un gain de 12% entre DDR4-2133 et DDR4-3200, contre seulement 8% sur les Core i7.


Diminuer la latence apporte un gain similaire, environ 3% sur le 1800X et le Core i7 quadruple canal.

Page 6 - Jeux : Total War Warhammer et Watch Dogs 2

# Total War Warhammer

Ce nouvel opus dans la série des Total War a droit lui aussi à une nouvelle version du moteur graphique de The Creative Assembly. Un mode DirectX 12 est présent, mais il est significativement moins performant sur notre GeForce GTX 1080 de test quelque soit le processeur et nous utilisons donc le mode DirectX 11. Nous mesurons les performances sur la première scène de campagne du jeu. Un benchmark est également intégré au jeu, et s'il semble gourmand à l'oeil, en pratique il ne l'est pas du tout pour le processeur.


Les gains sont encore une fois plus élevés sur le R7, même s'il faut tempérer : ce sont surtout les performances en DDR4-2133 qui semblent limitées. Entre DDR4-2400 et 3200, on obtient 10% de gains, contre un peu plus de 7% pour le Core i7 en quadruple canal, et un peu plus de 8% en double canal.


Jouer sur la latence apporte un gain d'environ 4%, ce qui est assez similaire avec les autres titres jusqu'ici.

Watch Dogs 2

Le titre d'Ubisoft dispose lui aussi d'un moteur particulièrement bien threadé. Nous mesurons les performances sur un déplacement dans une zone particulièrement dense et gourmande de la ville. Le jeu est réglé en mode Ultra, nous désactivons le SSAO.


On gagne en moyenne deux fois plus avec de la mémoire rapide sur Ryzen que sur un Core i7, ce qui est intéressant même si on note que le déficit est net par rapport à la plateforme d'Intel.


Le gain apporté par une réduction de la latence est d'environ 4%.

Page 7 - Impact des ranks

Nous nous en étions émus il y a un mois de cela, le support mémoire "officiel" annoncé par AMD pour Ryzen est particulier :

AMD distingue deux facteurs importants, le nombre de barrettes installées, et les Rank. Pour rappel, la notion de Rank correspond à l'organisation interne d'une barrette mémoire. Une barrette Single Ranked se reconnaît en général au fait que l'on ne voit des puces mémoires que sur une face, tandis que les mémoires Dual ranked ont des puces des deux côtés.

Il s'agit d'une organisation interne, chaque Rank étant indépendant, mais tous les Ranks partagent la bande passante du slot mémoire. Le contrôleur mémoire peut toutefois améliorer les performances mémoire et masquer certaines latences en alternant les données et donc les accès, c'est ce qu'on appelle le Rank Interleaving.

Aujourd'hui, les barrettes de 8 Go les plus courantes sont, en général, de type Single Ranked, alors qu'en 16 Go elles sont de type Dual Ranked.

En pratique, avoir deux barrettes Single Ranked sur un même canal mémoire, ou une seule barrette Dual Ranked est considéré comme équivalent, quelque chose que l'on ressent un peu dans le support officiel d'AMD (et qui paraissait encore plus évident dans la version précédente de ce document).

Pour réaliser nos dossiers sur le 1800X et les 1700X et 1700, nous avons utilisé quatre barrettes mémoires Single Ranked de 4 Go.

Ce choix avait été réalisé avant que nous connaissions les règles complexes du support de Ryzen pour une raison simple : choisir quatre barrettes nous permet de garder la même configuration mémoire entre toutes les plateformes (le X99 d'Intel réclamant quatre barrettes en quadruple canal) pour avoir des mesures de consommation les plus précises possibles.

En voulant vérifier le support sur deux barrettes uniquement, nous avions constaté un écart de performance non négligeable dans cette configuration, par rapport à ce que nous avions obtenus avec nos quatre barrettes.

Pour voir ce qu'il en est en pratique, nous avons utilisés les mêmes benchs que précédemment et comparé plusieurs configurations mémoire :

  • 2 barrettes 8 Go Single Ranked
  • 4 barrettes 4 Go Single Ranked
  • 2 barrettes 8 Go Dual Ranked

Dans le cas du 6900K, nous rajoutons également les performances en mode quadruple canal avec 4 barrettes Single Ranked. Notez que le contrôleur Intel est capable de fonctionner avec un Command Rate de 1T dans tous ces cas, alors que sur Ryzen il est fixe à 1T avec 2 Ranks et 2T avec 4 Ranks.

Core i7 6900K

Commençons par le processeur d'Intel :


[ Applications ] [ Jeux ]

Petite surprise, les gains sont beaucoup plus importants que ce à quoi l'on pouvait s'attendre. En général, on considèrait autrefois que le gain apporté par des ranks supplémentaires était marginal. Dans des applications qui stressent réellement le contrôleur mémoire on note 10% d'écart tout de même !

En pratique, disposer de quatre barrettes Single Ranked ou de deux barrettes Dual Ranked apporte un gain similaire, avec un léger avantage pour la configuration sur deux barrettes sur cette plateforme même s'il est excessivement léger.

Il est surtout intéressant de noter que les scores s'approchent franchement de ce que l'on obtient en mode quadruple canal, laissant penser que l'on est surtout limité par le nombre de Ranks accessibles que par la bande passante à proprement parler dans 7-Zip et WinRAR.

Dans les jeux, on note des gains un peu plus proches de ce à quoi on pouvait s'attendre, 2% dans la marge basse et jusque 4% pour Battlefield 1 et Total War. Des gains qui ne sont pas négligeables, 4% représente pour rappel ce que l'on gagne en passant de CL16 à CL12 dans la plupart des jeux.

Ryzen 7 1800X

Quid de la situation sur 1800X ?


[ Applications ] [ Jeux ]

Avant d'aller plus loin, vous noterez l'absence des résultats pour la configuration 2 barrettes Dual Ranked. Nous avions utilisé pour ce test un kit Crucial Ballistix Sport DDR4-2400 CL16 à 1.2V, cependant ce dernier n'a pas voulu fonctionner le temps entier de notre protocole sur notre carte mère Ryzen. Nous avons simplement pu vérifier sur 7-Zip que les résultats étaient bien similaires à ceux obtenus avec 4 barrettes Single Ranked.

Dans les applications, on obtient des gains un peu plus faibles que sur le Core i7 sous 7-Zip et WinRAR, et légèrement supérieurs sous Visual studio. Dans les jeux, les gains liés au nombre de Ranks sont par contre légèrement supérieurs à ceux obtenus sur Intel, entre 3 et 6%.

Page 8 - Un choix complexifié par un support compliqué

Le fait que le data fabric de Ryzen soit indexé sur la fréquence mémoire a fait naître beaucoup de spéculations sur l'impact de la fréquence mémoire sur la nouvelle plateforme d'AMD.

Nos mesures montrent que la fréquence mémoire influe plus fortement qu'à l'habitude sur la latence mémoire de Ryzen, ce qui n'est pas une mauvaise chose tant cette dernière est élevée.

En pratique, on retrouve des gains parfois intéressants. Dans les applications, ils sont assez proches de ceux obtenus chez Intel, parfois un peu en dessous, parfois un peu au-dessus, mais globalement assez similaires.

C'est dans les jeux que les gains sont un peu plus importants, ce qui est une bonne chose même s'il nous faut tempérer par rapport à nos dossiers précédents : les gains sont ici obtenus avec seulement deux barrettes mémoires Single Ranked, tandis que les performances relevées dans nos articles le sont avec quatre barrettes mémoires Single Ranked. On perdra donc une partie des gains en revenant à une configuration à deux barrettes mémoires qui "perd" un peu plus que la concurrence dans les jeux.

Pour illustrer cela, nous avons rapporté différentes configurations mémoires sur un même graphique sur 6 des tests pratiques. Vous retrouverez en bleu les scores avec quatre barrettes Single Ranked, soit la configuration de nos articles précédents, comparés aux solutions testées aujourd'hui :


Côté applicatif, il faut globalement être en DDR4-3200 pour égaler ou battre notre modeste configuration à base de quatre barrettes DDR4-2400, alors que côté jeu on est équivalent à de la DDR4-2933 pour Watch Dogs 2 et Battlefield 1. Il n'y a que Project Cars qui profite ici nettement de mémoire rapide. Au final, les gains apportés par une mémoire plus rapide sont donc très relatifs !

Et c'est bien là que se complexifie la situation pour ceux souhaitant tirer le maximum de leur Ryzen : idéalement il faudrait donc disposer de 2 DIMM Dual Ranked ou 4 DIMM Single Ranked à des fréquences DDR4 élevées... or ces deux conditions sont opposées : fréquence ou ranks, il faut choisir !

En pratique dans nos tests, nous avons pu tenir au maximum le mode DDR4-2666 avec quatre barrettes mémoires Single Ranked (via un kit Ripjaws 4), ce qui semble dans la moyenne haute de ce qui est possible : DDR4-2400 semble assez courant avec quatre barrettes, et pour rappel la spécification officielle est DDR4-2133. Notre expérience avec la mémoire Dual Ranked sur Ryzen a été encore pire, ne dépassant pas le mode DDR4-2133 de manière stable avec notre kit, sous les DDR4-2400 officiellement supportés.

La situation ne restera cependant pas figée. Pour rappel, AMD a annoncé deux mises à jour successives prévues :

  • une première en avril qui réduirait la latence de 6 nanosecondes
  • une seconde en mai spécifique à "l'overclocking RAM"

Pour la première, on restera prudent sur cette diminution de la latence sans plus de précisions, on ne sait pas à quel fréquence cela s'applique par exemple. Si cela se vérifiait, à 2400 MHz, cela équivaudrait à 3/4% de performances dans les jeux (à peu près l'équivalent de passer d'un CL16 à CL12) ce qui serait toujours bon à prendre.

Pour la seconde, AMD pourrait ajouter de nouveaux multiplicateurs mémoires, mais l'on ne sait rien de la question épineuse de la compatibilité avec les barrettes DDR4 rapides qui semble très variable selon les puces mémoires embarquées sur les barrettes, au-delà même du support des Ranks. Il faut ajouter à cela un support qui peut être variable d'un constructeur de cartes mères à l'autre, et même entre plusieurs modèles d'une même marque tant les bios ne sont pas forcément mis à jour simultanément pour tous les modèles d'une gamme chez certains d'entre eux. Là encore au fil des semaines c'est une situation qui devrait naturellement s'arranger, les BIOS étant mis à jour progressivement et les constructeurs apprenant et améliorant leur propre support en regardant ce que font leurs concurrents.

Dans l'attente, si vous souhaitez profiter des gains offerts par 2 ranks à fréquence élevée ou 4 ranks il faudra choisir votre mémoire plus attentivement que pour 2 ranks à fréquence plus classique. A défaut de partir sur un kit "certifié" comme le kit G.Skill Flare X que nous avons utilisés ici, on vous conseille de vérifier la liste de compatibilité proposée par le fabricant de votre carte mère sur son site, ainsi que les retours d'autres utilisateurs en espérant qu'assez rapidement la situation se simplifie pour tout le monde !

Copyright © 1997-2018 HardWare.fr. Tous droits réservés.