Performances CPU : Catalyst 14.7 RC3 vs GeForce 340.52 Cartes Graphiques Publié le Mardi 16 Septembre 2014 par Marc Prieur URL: /focus/100/.html Suite à la mise en place de notre nouveau protocole de test processeur, nous avons voulu mesurer l'impact des pilotes graphiques dans nos tests jeux 3D qui sont principalement limités par la puissance CPU. En effet l'initiative Mantle d'AMD, suivie depuis par Microsoft avec un DirectX 12 prévu pour 2015, a mis en lumière le (sur)coût processeur des commandes de rendu sur les API actuelles, domaine dans lequel les pilotes peuvent avoir un impact. En pratique le premier jeu à en bénéficier fut Battlefield 4, avec des gains impressionnants puisque pouvant atteindre 80% par rapport au jeu fonctionnant en Direct3D sur la même carte AMD lorsque les performances sont limitées par le CPU et non pas par le GPU ! Mais ce lancement avait également montré que le gain était environ deux fois moindre si l'on comparait aux performances Direct3D sur une carte Nvidia, preuve que le pilote des verts était mieux optimisé en D3D pour ce cas de figure. Plus une API graphique est complexe, prend des chemins tortueux et accuse un surcoût ou overhead élevé, plus les fabricants de GPU ont d'opportunités de se démarquer de la concurrence via leurs pilotes. De plus, des optimisations qui sont cette fois destinées à optimiser le coût du GPU, tels que les remplacements de shaders, peuvent de leur côté alourdir la charge processeur liée au pilotes. Il existe des opportunités d'optimisation de l'usage CPU, même sous les API DirectX actuelles, elles ne sont pas nouvelles puisque fin 2008 nous avions déjà remarqué un avantage en faveur des pilotes Nvidia face aux pilotes AMD pour ce qui était des performances sur quatre cœur sous DirectX 10, souci sur lequel AMD avait réagi début 2009. Depuis cet aspect n'avait pas été souvent observé, les tests de GPU s'orientant logiquement vers les mesures de puissance graphique et donc dans des cas où ce n'est pas le CPU qui limite le framerate final, plutôt que sur l'optimisation des pilotes vis-à-vis des processeurs. L'introduction de Mantle aura toutefois rappelé qu'il peut y avoir des différences importantes à ce niveau, et Nvidia avait d'ailleurs profité de la GDC 2014 pour annoncer des avancées supplémentaires dans ce domaine sur son pilote Direct3D qui ont été introduites dès le mois d'avril. Nous avions mesuré les écarts lors du test de la Radeon R9 295X2. Notre nouveau protocole de test introduit avec les Haswell-E utilisant une GeForce GTX 780 Ti couplée aux pilotes 340.52, nous nous sommes dit que l'occasion était bonne pour comparer les pilotes Direct3D, mais aussi OpenGL dans le cas de X-Plane, AMD et Nvidia. Nous avons donc fait subir à deux processeurs, un AMD FX-8350 et un Core i5-4670K, les mêmes tests avec cette fois une Radeon R9 290X et les pilotes Catalyst 14.7 RC3. Attention il ne s'agit donc pas d'une comparaison entre les GPU R9 290X et GTX 780 Ti, les performances étant dans tous les cas limitées ici par la puissance de traitement du CPU. Nous sommes dans des cas appelés "CPU limited", c’est-à-dire que la création de la scène 3D côté CPU met plus de temps que le rendu de la scène 3D côté GPU. Dans ce cas les performances sont limitées par la première partie, puisque le GPU "attends" les informations lui permettant de rendre la scène. Pour schématiser, s’il faut 20ms (soit 1/50è de secondes) côté CPU et 10ms (soit 1/100è de secondes) côté GPU alors le framerate sera limité à 50 images/s du fait de la valeur la plus élevée, les deux temps ne s’accumulant heureusement pas puisque pendant le rendu GPU le CPU ne se tourne pas les pouces mais prépare l’image suivante. CPU Limited ? Vu les nombreux commentaires générés par cet article, cette notion de "CPU limited" semble être très floue pour une partie de notre lectorat, bien que nous l'ayons déjà abordée à de multiples reprises. Des explications sont donc nécessaires. Pour schématiser, la création de ce que vous voyez à l'écran dans un jeu peut être découpée en plusieurs grandes étapes. Ces résultats nous montrent qu'avec 4 cœurs, nous sommes systématiquement "CPU limited", sauf sur la GTX 680 en 1920*1080 MSAA 4x qui voit son score légèrement baisser par rapport aux résolutions précédentes. La limite processeur est aux alentours de 34 fps sur avec les Nvidia, et à 32 fps avec la 290X, l'avantage est donc à Nvidia et ses pilotes sur ce jeu. Les tests avec 8 cœurs permettent de réduire le temps de traitement côté processeur, ce qui permet avec une charge GPU réduite (1280*720) d'atteindre 56 fps environ sur Nvidia et 49 fps sur AMD du fait de limite côté processeur - on note au passage que l'écart en faveur de Nvidia augmente. En augmentant la charge côté GPU avec le passage en 1920*1080 et surtout en 1920*1080 MSAA 4x les écarts de puissance entre les GPU se font sentir, le temps de traitement GPU étant devenu le facteur limitant pour le framerate final. Cela permet par exemple à la R9 290X 'Uber' de logiquement repasser devant la GTX 680, la GTX 780 Ti OC étant en tête sous ce jeu. Avoir une bonne connaissance de ces principes peut vous être très utile en pratique. En effet, si vous éprouvez des ralentissements dans un jeu, il vous sera désormais aisé de savoir si vous êtes plutôt limité par la puissance processeur ou plutôt par la puissance GPU que vous avez à disposition : baissez les paramètres qui impactent exclusivement son temps de rendu, comme l'anticrénelage ou la résolution (tout en conservant le même ratio) : si le framerate augmente alors vous étiez très probablement limité par le GPU. Pour obtenir de meilleure performance en pratique sans baisser la résolution - et sans changer de GPU - vous pourrez si vous ne voulez pas faire de sacrifice sur la résolution désactiver les effets de post-processing par exemple tel que le flou de mouvement si ils activés. Il vous sera également possible de changer de GPU sans craindre d'être limité par le processeur, tout du moins sur le jeu et la scène utilisée. A contrario si le framerate n'augmente pas malgré cette baisse de paramètres jouant sur la charge GPU, vous êtes probablement limité par la vitesse du traitement du processeur dans toute la partie préalable au rendu GPU, une charge qui peut également être impacté par l'optimisation des pilotes graphique. A défaut de changer votre processeur ou de l'overclockez, vous pouvez jouer sur des paramètres jouant principalement (mais pas exclusivement) sur lui, par exemple le nombre d'objets visible dans la scène (via un niveau de détail spécifique ou la distance de vue). Ceci étant dit nous allons maintenant pouvoir passer aux mesures concernant le sujet de l'article, à savoir la mesure des écarts de performances dans des cas "CPU limited" entre AMD et Nvidia. Crysis 3 Sous Crysis 3 nous utilisons une sauvegarde sur une zone particulièrement chargée du jeu dans laquelle nous avançons pendant 20s afin d'avoir un framerate moyen. Les tests sont effectués en 1920*1080 Very High, sans anti-aliasing. Que ce soit sur processeur AMD ou Intel, les pilotes Nvidia permettent d'offrir des performances supérieures d'un peu plus de 8% en cas de limite processeur comme sur notre scène de test. Arma III Pour Arma III nous chargeons une sauvegarde lors d'un entrainement en hélicoptère dans laquelle nous survolons pendant 20s l'ile de Stratis. Les tests sont effectués en 1920*1080 Ultra, sans anti-aliasing. Le comportement est différent sous Arma III puisque cette fois ce sont les pilotes AMD qui sont les plus véloces sur Core i5 (+2,5%), avec un très léger avantage pour Nvidia sur AMD FX. X-Plane 10 X-Plane 10 est autant un jeu qu'un logiciel de simulation de vol. Nous utilisons 20s du benchmark intégré qui est un replay d'une approche d'un survol en basse altitude d'une ville et d'un aéroport avec les options –fps 3 qui correspondent à un niveau de détail très élevé, en 1920*1080 sans anti-aliasing. X-Plane est le seul jeu OpenGL de notre protocole de test et il permet aux processeurs lorsqu'ils sont combinés avec des pilotes Nvidia d'afficher des performances environ 10% plus élevées qu'avec les pilotes AMD. F1 2013 F1 2013 est notre quatrième jeu, nous utilisons le benchmark intégré qui est modifié afin d'avoir un départ du GP d'Abu Dhabi sous un temps pluvieux. Nous mesurons le framerate moyen durant les 20 premières secondes du départ, en 1920*1080 Ultra sans anti-aliasing. Sous F1 2013 l'écart est important, ainsi sur le FX-8350 les pilotes Nvidia sont 15% plus rapides, contre 9,8% sur le Core i5-4670K. Watch Dogs Le framerate de Watch Dogs est pour sa part mesuré lors d'une course de 20s dans une partie assez chargée du jeu. Nous avons trouvé des scènes avec des framerate 10 à 20% inférieurs mais le système de sauvegarde automatique nous a empêché de les utiliser de manière très reproductible, tout comme l'environnement changeant. Les performances sont mesurées en 1920*1080 avec un niveau de qualité générale à Ultra mais sans anti-aliasing. Watch Dogs est le jeu sur lequel les pilotes AMD sont le moins à l'aise en cas de limite processeur, avec un avantage de 25% pour Nvidia sur FX-8350 et 13,6% sur i5-4670K. Du coup, si avec une carte Nvidia les deux processeurs ont des performances proches, avec une carte AMD l'i5 prend un avantage plus net ! Total War : Rome II Pour Total War : Rome II nous mesurons simplement le framerate lors de la première scène de jeu du prologue, en 1920*1080 Extreme mais en désactivant l'AA et le SSAO. Sous Total War Rome II on note un avantage de 7,2% en faveur de Nvidia sur FX-8350 et 5,6% sur i5-4670K. Company of Heroes 2 Pour Company of Heroes 2 nous utilisons les 20 dernières secondes du benchmark intégré pour obtenir un framerate moyen en 1920*1080 et qualité maximale exception faite de l'anti-aliasing. Là encore l'avantage est à Nvidia avec 7% de mieux face aux pilotes AMD sur FX-8350 et 2,6% sur i5-4670K. Anno 2070 Enfin pour Anno 2070 nous chargeons une sauvegarde d'une cité de 220 000 habitants que nous visualisons pendant 20s depuis une vue éloignée, le tout en 1920*1080 avec réglages très élevés et toujours sans anti-aliasing. Nvidia finit de nouveau devant avec un avantage de 6,7% sur processeur AMD et 3,6% sur processeur Intel. Conclusion Si les résultats sont disparates, à l'exception d'une mesure ils montrent tout de même un avantage notable des pilotes Nvidia pour ce qui est de la demande en puissance processeur. En moyenne cet avantage est de 6,2% sur Core i5-4670K, et il monte même à 10,3% sur AMD FX-8350, probablement du fait d'une meilleure utilisation de ses multiples cœurs, un comble ! Copyright © 1997-2024 HardWare.fr. Tous droits réservés. |