Dual core : Athlon 64 X2 4800+ et 4400+ Processeurs Publié le Lundi 9 Mai 2005 par Marc Prieur URL: /articles/571-1/dual-core-athlon-64-x2-4800-4400.html Page 1 - Les choix d'AMD ![]() Les choses se sont récemment accélérées, Intel ayant décidé de se lancer dans la course à celui qui annonçait le premier processeur x86 dual core. Le géant de Santa Clara a ainsi grillé la politesse à AMD en annonçant le 18 avril son Pentium Extreme Edition auquel nous avons déjà consacré un dossier. Trois jours plus tard, et comme c’était déjà prévu depuis longue date, AMD annonçait de son côté les Opteron dual core destinés aux serveurs et stations de travail, et pré-annonçait pour répondre à Intel ses Athlon 64 X2 destinés aux PC de bureau. Ces processeurs ne devaient être disponibles pour test et dans le commerce qu’en juin, mais les tests sont finalement avancés ce qui nous donne l’occasion de vous présenter l’Athlon 64 X2 dès aujourd’hui au travers de ce dossier. Les choix d’AMDGravé en 90nm, l’Athlon 64 X2 est composé d’un unique die de 199mm² intégrant pas moins de 233 millions de transistors selon AMD. A titre de comparaison, un Pentium dual core fait pour sa part 206 mm² pour 230 millions de transistors. Comme chez Intel, le dual core AMD reprend un principe très simple puisqu’il s’agit de disposer de deux processeurs venant s’insérer au sein d’un même Socket. ![]() Toutefois, AMD a été nettement plus loin dans l’intégration des deux cores puisque ces derniers sont véritablement imbriqués là où Intel s’est en quelque sorte contenté d’accoler deux core de Pentium 4. Les deux cores d’AMD se partagent donc un même contrôleur mémoire intégré, et peuvent communiquer directement sans passer par le chipset externe de la carte mère comme c’est le cas chez Intel. ![]() 1 : CPU 0 , 2 : Cache L2 CPU 0, 3 : CPU 1, 4 : Cache L2 CPU 1 5 : System Request Interface, Crossbar Switch, Memory Controller, Hypertransport Le seul véritable regret vis-à-vis de ce choix est que comme chez Intel la bande passante mémoire disponible n’augmente pas par rapport à un processeur simple core. Pour ce faire, il aurait en effet fallu intégrer un second contrôleur mémoire … et AMD aurait alors dû mettre de côté le gros avantage de son architecture dual core : la compatibilité ! En effet, les Athlon 64 X2 ont l’avantage d’être compatibles avec toutes les cartes mères Socket 939 existantes. Pour ce qui est des Opteron dual core, ils sont compatibles avec toutes les cartes mères Socket 940 supportant les processeurs simple core gravés en 90nm. Dans les deux cas, une simple mise à jour de bios suffira ! Côté dissipation, AMD indique que ces processeurs dual core atteignent dans le pire des cas 110 Watts. L’augmentation est donc très légère par rapport aux 104 Watts annoncés pour l’Athlon FX-55. Page 2 - Les Athlon 64 X2 Les Athlon 64 X24 modèles différents d’Athlon 64 X2 devraient être disponibles en Juin d’après AMD, les Athlon 64 X2 4800+, 4600+, 4400+ et 4200+. On peut déjà s’étonner au premier abord d’un tel P-Rating. ![]() En effet, l’Athlon 64 X2 4800+ apporte plus ou moins des performances brutes doublées par rapport à un Athlon 64 4000+, pourquoi alors ne lui attribuer que des gains de l’ordre de 20% ? Tout simplement parce que la suite de test utilisée par AMD pour fixer le P-Rating est composée de certains logiciels multithreadés et de certains autres qui ne le sont pas. Bien entendu le P-Rating démontre ici toutes ses limites puisqu’on peut dire que l’Athlon 64 X2 4800+ est en fait un Athlon 64 X2 4000+ à 8000+ selon les scénarios applicatifs. Le tableau ci-dessous récapitule les caractéristiques principale des 4 Athlon 64 X2, qui se différencient les uns des autres de par leur fréquence et/ou la taille du cache de second niveau de chaque core. Nous avons également reporté l’équivalent single core de ces processeurs et il en découle le coût demandé par AMD pour le second core : ![]() En clair et comme vous pouvez le voir, un processeur dual core coûte en moyenne deux fois plus cher qu’un processeur simple core doté d’un core aux fréquence et cache identiques, pour un P-Rating qui augmente de 20% donc. Bien entendu AMD est capable de produire sur une même galette de silicium, à condition d’avoir des yields équivalents, deux fois moins de processeur dual core ce qui fait que cette tarification peut se comprendre d’autant que la FAB30 d’AMD tourne déjà à plein régime. Moins compréhensible est toutefois le ticket d’entrée demandé qui est de 537$. C’est cher, et un Athlon 64 X2 à 1.8 GHz / 512 Ko de cache L2 à 2x149$ (le double d’un A64 3000+) n’aurait pas été de trop. Malheureusement son P-Rating aurait été de 3600+ et AMD a apparemment décidé, au moins dans un premier temps, que le P-Rating des dual core serait supérieur à celui des simple core, ce qui explique d’ailleurs qu’aucun nouvel Athlon 64 simple core ne sortira – il s’agira uniquement d’Athlon 64 FX. Décidément, le P-Rating a tout pour nous déplaire sur ce coup ! A contrario voici la politique d’Intel en ce qui concerne ses processeurs dual core : ![]() Cette fois, on ne peut pas vraiment parler d’équivalent simple core sauf dans le cas du PEE 840 qui correspond à 2 Pentium 4 540. En effet, dans les autres cas, on a d’un côté sur les Pentium D des core dépourvus d’HyperThreading, et de l’autre sur Pentium 4 d’autres qui en sont dotés. On notera toutefois que la différentiation principale en AMD et Intel est que les dual core d’AMD sont hauts de gamme, alors que les dual core Intel sont moyens de gamme. En effet chez AMD un seul processeur simple core est plus rapide qu’un des deux core d’un Athlon 64 4800+, c’est le FX-55. Chez Intel, les Pentium 4 570, 560 et 550 sont plus rapide qu’un des deux cores du Pentium Extreme Edition 840. Il en découle un ticket d’entrée bien plus bas chez Intel puisque le Pentium D 820 est à « seulement » 241$. Bien entendu, dans la majorité des cas il ne s’agira pas d’une foudre de guerre, mais dans l’optique d’une utilisation principale du PC demandant de la puissance dans des applications fortement multithreadées ce processeur sera une excellente affaire en face de laquelle AMD n’a rien à proposer. Page 3 - En pratique En pratique ![]() ![]() ![]() ![]() Nous avons effectué les tests sur une ASUSTeK A8N SLI Deluxe. Avec son bios initial, le système démarre correctement, ce qui est un point positif, mais un seul des deux processeurs est reconnu, ce à quoi on pouvait s’attendre. Après une mise à jour du bios avec la version 1009.001 fournie par ASUSTeK, le processeur et ses deux cores sont parfaitement reconnus. ![]() ![]() Comme vous pouvez le voir l’Athlon 64 X2 supporte, comme la dernière révision « E » des Athlon 64, le SSE3, dont nous étudierons plus loin l’impact sous TMPGEnc. La tension nominale d’alimentation de notre modèle de test est de 1.35V (1.36V réels), la fourchette donnée par AMD étant 1.35-1.4V, selon les CPUs. ![]() Nous avons ensuite mesuré la consommation de la configuration en charge sous Prime 95, avec plusieurs sessions de Prime95 si nécessaire pour charger le processeur à 100%. Il s’agit de la consommation de la totalité de la configuration (carte mère, 2x512 Mo de mémoire DDR, X850 XT PE, 2 Raptor). La mesure étant effectuée à la sortie de la prise de courant, la consommation réelle de la configuration est donc moindre puisque le rendement d’une alimentation est de 70 à 80%. ![]() Les chiffres parlent d’eux-mêmes, un Athlon 64 X2 4800+ ne consomme ici pas plus qu’un Athlon 64 FX-55 ! La consommation affichée est tout ce qu’il y a de plus raisonnable et comparable aux processeurs Athlon 64 130nm haut de gamme dotés de 1 Mo de cache L2. Au passage, on notera le net avantage apporté par le 90nm lorsque l’on compare les versions 3800+ 130nm et 90nm. En terme de consommation AMD fait donc mieux qu’Intel puisque nous avions mesuré un surplus de 50 Watts lors du passage d’un Pentium 4 EE 3.73 GHz à un Pentium EE 3.2 GHz dual core. Côté température, en charge avec le ventilateur Thermaltake et avec un air ambiant à 26°C on atteint les 53°C. ![]() Quid de l’overclocking ? Si les 2.5 GHz ont pu être atteints facilement à la tension initiale de 1.35V, il a ensuite fallu passer à 1.5V pour gagner 100 petits MHz, le tout de manière stabilisée avec une charge constituée de deux sessions de Prime95 (on pouvait allez plus haut en ne chargeant qu´un des deux CPU ou en les chargent pas, mais bon ...). Du coup, la consommation explose puisque l’on atteint alors pour la configuration 265 Watts et la température en charge passe à 70°C avec le ventirad de base. Dans ces conditions, nous n’avons pas tenté d’aller plus loin afin de ne pas endommager le processeur du fait d’une suralimentation. Si notre processeur de test s’avère être représentatif, il semble clair que les Athlon 64 X2 ne sont pas pour le moment des foudres de guerre côté overclocking et que la marge de manœuvre est très faible chez AMD en terme de fréquence. Intel n’a pas directement ce problème, mais par contre ses processeurs dual core ne peuvent pas vraiment être lancés à des fréquences supérieures du fait de leur dissipation qui sera trop importante. Page 4 - Le test Le testPour ce test nous avons simplement repris le protocole mis au point pour notre dossier sur les Pentium dual core. Les processeurs AMD testés sont les suivants : - AMD Athlon 64 X2 4800+ - AMD Athlon 64 X2 4400+ - AMD Athlon 64 FX-55 - AMD Athlon 64 4000+ Le FX-55 représente le processeur simple core AMD le plus performant, alors que le 4000+ est juste derrière et a l’avantage d’être deux fois moins cher. Il est également cadencé à 2.4 GHz pour 1 Mo de cache L2, ce qui correspond à un core de X2 4800+ et ce qui nous permet d’évaluer l’apport du dual core même si il ne faut pas perdre de vue que les dual core utilisent le dernier core 90nm / révision E de l’architecture AMD au contraire des FX-55 et 4000+ de test qui sont encore des 130nm. On trouve ensuite les processeurs Intel suivants : - Intel Pentium Extreme Edition 840 à 3.2 GHz - Intel Pentium D 840 à 3.2 GHz - Intel Pentium D 820 à 2.8 GHz - Intel Pentium 4 540 à 3.2 GHz - Intel Pentium 4 540 à 3.2 GHz avec HyperThreading désactivé - Intel Pentium 4 Extreme Edition 3.73 GHz - Intel Pentium 4 660 3.6 GHz Nous avons rajouté par rapport au dossier Intel dual core le Pentium D 820 à 2.8 GHz du fait de sa tarification très avantageuse. On trouve ensuite le P4 540 avec ou sans HyperThreading pour des raisons de test théorique ainsi que les processeurs simple core les plus performants d’Intel. Les configurations utilisées étaient les suivantes : Intel Socket 775 : - Carte mère D955XBK - ATI Radeon X850 XT PE - 2 x 512 Mo DDR2-667 4-4-4 - 2 x Raptor 74 Go - Windows XP SP2 Français AMD Socket 939 - Carte mère ASUS A8N SLI bios 1006 - Carte mère ASUS A8N SLI bios 1009.001 (dual core) - ATI Radeon X850 XT PE - 2 x 512 Mo DDR-400 2-2-2 - 2 x Raptor 74 Go - Windows XP SP2 Français Comme sur le test des Pentium Dual core notre protocole a été modifié par rapport aux précédents tests et les remarques sur ces changements sont donc incluses pour chacun de tests. Page 5 - 3d studio max 7, Maya 6 3d studio max 7Pour 3d studio max, nous effectuons le rendu via le moteur de rendu interne de 3ds (scanline) d’une scène mise au point par Studio PC qui fait fortement appel à la radiosité, la première scène un peu vieillotte aillant été abandonnée. Ce type de rendu plus réaliste au niveau des éclairages est aussi plus lent, et 80% du temps de rendu est passé sur ce type d’effet au sein de cette scène. ![]() Comme tous les logiciels de rendu 3D, 3ds max 7 se régale de la présence de plusieurs processeurs. Ainsi, le gain apporté par le dual core par rapport à un simple core équivalent est ici de 74.7% chez AMD, 73% chez Intel sans HyperThreading, et 72.9 avec HyperThreading. Les gains sont donc comparables, quoique légèrement en faveur d’AMD. Toutefois il ne faut pas perdre de vue que chez Intel on passe généralement d’un processeur simple core avec HyperThreading à un processeur dual core sans (sauf pour le EE), et que dans cette configuration le gain n’est plus « que » de 41.7%. Du coup, si en simple core Intel menait la danse sous ce test, en dual core c’est AMD qui prend les devants. On notera toutefois, comme prévu, les excellentes performances d’un Pentium D 820 dans ce type d’application tirant fortement partie du multi thread : pour 241$, il est plus véloce que des processeurs simple core qui sont jusqu’à 4 fois plus onéreux ! Maya 6Nous n´avons pas utilisé le moteur de rendu Maya Software, dont le développement a été clairement mis de côté par Maya du fait de l’intégration du moteur de rendu Mental Ray, pour ce dernier. Nous utilisons une scène mise au point par Yann Dupont de 3DVF que nous remercions. ![]() Les gains sont une nouvelle fois importants lors du passage d’un à deux core puisque de 96.2% chez AMD, 96.3% chez Intel sans HT et 50.1% avec, l’HT faisant ici baisser les performances sur le dual core. La passage d’un 3.2 GHz HT mono core à un 3.2 GHz sans HT bi core entraîne pour sa part un gain de 50.1%. Du coup, si le match était serré entre AMD et Intel sur les processeurs simple core, on assiste à une outrageuse domination d’AMD sur le dual core, cet écart étant en grande partie lié à ces problèmes de performances lors de l’activation de l’HyperThreading sur un processeur dual core dans certains cas. Seul le Pentium D 820 vient ici sauver l’honneur chez Intel du fait de sa tarification. Page 6 - Mathematica 5.1, WinRAR 3.5 Mathematica 5.1Voici venue l’heure des calculs scientifiques, avec Mathematica de Wolfram Research. Nous sommes passés à la version 5.1 du logiciel, tout en conservant la suite de tests développée par Stefan Steinhaus. ![]() De base Mathematica ne tire pas partie de plusieurs processeurs pour les calculs effectués dans cette suite de tests. Pour ce faire, il faudrait en fait effectuer les calculs en parallèle sous deux Kernels de Mathematica, soit à la main, soit avec un programme dédié qui utiliserait l’API MathLink pour gérer plusieurs Kernels en parallèle. Du coup les processeurs dual core arrivent au niveau d’un processeur simple core et sont donc désavantagés par leur fréquence inférieure. Comme c’est généralement le cas dans le domaine des calculs scientifiques, AMD domine ce test, et au contraire des tests multi threadés le P-D 820 n’est pas vraiment à son avantage ce qui est logique puisqu’il se comporte comme un « simple » Pentium 4 2.8 GHz … WinRAR 3.5Un total de 588 Mo de fichiers, répartis en 493 fichiers Word & Excel (69 Mo), 22 fichiers de boite e-mail Eudora (251 Mo) et 1 fichier audio au format wav (268 Mo), sont compressés via WinRAR 3.5 en utilisant la compression la plus poussée. ![]() L’avantage de ce test est d’être très dépendant des performances du couple chipset + mémoire, son désavantage est de ne pas être multithread. Les remarques sont donc identiques à celles effectuées sous Mathematica, et ce sont d’ailleurs également les processeurs AMD qui dominent ici grâce notamment à leur contrôleur mémoire intégré. Page 7 - TMPGEnc 3, Vdub + DiVX 5 TMPGEnc 3.0 XpressSous TMPGEnc, désormais en version 3.1.5.8, nous encodons un fichier DV de 10 minutes 16 secondes au format MPEG-2, en 720x576 avec un bitrate moyen de 4500 kbits /s et en 2 passes. L’affichage de la vidéo en mode preview est désactivé pendant ce test. ![]() Particulièrement optimisé pour le multi thread mais aussi pour le SSE (version 3 incluse), TMPGEnc profite grandement du passage au dual core sur Athlon 64 puisque le gain à fréquence / cache équivalent par core est de … 111.6% ! Ceci découle en fait du support du SSE3 sur le dual core, alors que notre 4000+ de test n’en était pas doté puisqu’il s’agissait d’une version 130nm. En effet le gain apporté par le support du SSE3 est ici d’environ 8.9%, et avec SSE3 désactivé le gain lié au dual core est tout de même de 94.4%. Le gain lié au SSE3 est donc assez proche de celui observé chez Intel puisque lors de nos premiers tests avec TMPEGEnc nous l’avions mesuré à 9.6%. Côté dual core chez Intel les gains sont respectivement de 90.4% sans HyperThreading de part et d’autre et 77.4% avec, et on dénote donc un léger avantage pour AMD qui est amplifié de part l’écart séparant un processeur mono core avec HT d’un dual core qui en est dépourvu (48.2%). Certes, ceci ne suffit pas à AMD pour prendre la tête dans ce test mais alors que Intel dominait outrageusement sur les processeurs mono core l’écart est ici très fortement réduit. On notera une fois de plus les très bonnes performances du Pentium D 820 étant donné sa tarification. DiVX 5.2.1 & VirtualDub 1.6.5VirtualDubMod, dont le développement est en retard sur VirtualDub, est abandonné au profit de ce dernier en version 1.6.5. Nous compressons la même vidéo que sous TMPGEnc en mode Fast recompress et via le codec DiVX 5.2.1 en une passe avec un bitrate moyen de 1500 kbits /s, b-frame et performance d’encodage standard. L’affichage de la vidéo en mode preview est désactivé pendant ce test. ![]() Virtualdub est multithreadé , mais pas pour l’encodage vidéo à proprement parlé : il dispose d’un thread pour l’interface utilisateur, d’un pour les I/O, d’un pour les previews et enfin d’un dernier pour le processing. Toutes les opérations de vidéos sont toutefois effectuées en série au sein de ce dernier thread, ce qui explique ici l’absence de gain notable lié au dual core, DiVX ne semblant pas non plus paralléliser l’encodage pur et dur. Les dual core sont donc ici désavantagés par rapport au mono core du fait de leurs fréquences inférieures. Dans le cadre d’un dual core, nous vous conseillons donc plutôt d’utiliser FlaskMPEG ou XMPEG, qui sont certes bien moins fonctionnels mais qui par contre savent mieux tirer partie d’un système dual core. Page 8 - Far Cry, Pacific Fighters Far CryVoici maintenant des performances dans des applications plus ludiques avec pour commencer Far Cry. Pas de changement majeur si ce n’est une légère modification de la scène de test qui est constituée d’un parcours sur la map training en exterieur, et l’utilisation d’une carte ATI. En effet nous avons remarqué que sur certains chipsets, avec certaines révisions de drivers NVIDIA dans ce type de scène assez lourd côté processeur les performances étaient parfois assez bizarres. ![]() Les jeux ne sont pas multithreadés, et ne devraient pas l’être majoritairement avant longtemps étant donné que cela est relativement difficile à faire. Selon EPIC , qui travaille sur l’Unreal Engine 3 qui sera multithreadé, un tel code demande 2 à 3 fois plus de temps de développement et ce n’est qu’à partir de fin 2006 que l’on devrait voir débarquer des jeux et des moteurs tirant pleinement partie d’un processeur dual core. Le dual core ne représente donc aucun intérêt sous Far Cry et les processeurs AMD sont comme c’est généralement le cas dans les applications ludiques nettement devant les solutions Intel, avec un Pentium D 820 occupant la queue du peloton. On notera un léger gain entre le 4800+ et le 4000+ chez AMD : il n’est pas vraiment lié au passage de 1 à 2 core mais changement de révision de ces cores entre ces CPUs. Pacific FightersPas de changements importants pour Pacific Fighters si ce n’est le passage à la version 3.04, et l’utilisation d’une carte ATI. ![]() Comme sous Far Cry on ne note pas de gain notable lié à l’augmentation du nombre de cores, et les performances des dual core sont donc en retrait du fait de leur fréquence inférieure. Même si beaucoup de jeux sont comme Far Cry nettement plus rapides sur Athlon 64 que sur Pentium 4, on peut voir ici que ce dernier s’en tire plutôt bien. Page 9 - Scénarios multitâches Scénarios multitâchesIl existe deux moyens pour tirer partie d’un bi processeur, qu’il se fasse via deux Sockets ou un seul. Les applications multi thread d’une part, mais également le multitâche d’autre part. Si l’introduction de l’HyperThreading chez Intel a notablement amélioré la réactivité du système lorsque l’on continue à l’utiliser malgré un traitement lourd, le dual core permet d’aller encore plus loin. Afin de mettre en évidence ceci nous avons effectué plusieurs tests : - Lecture vidéo avec rendu 3D ou compression vidéo en arrière plan - Rendu 3D et compression vidéo en arrière plan, et vice-versa - Jeu et compression vidéo en arrière plan Ces scénarios sont à prendre comme tels, c´est-à-dire comme une utilisation intensive de la machine. Tout le monde n’a pas besoin d’en faire autant, d’autant que ce type d’utilisation n’est pas habituelle pour la majorité d’entre nous, mais qui peut le plus peut le moins et l’avantage du bi processeur et donc du dual core est normalement de pouvoir supporter ce type de charge. Il faut également noter que l’extrapolation à partir de ces scénarios est tout à fait possible et même conseillée. Par exemple, le dernier scénario n’est pas simplement un scénario « Jeu et compression vidéo en arrière plan », c’est avant tout un scénario « Application monothreadée en premier plan nécessitant une très bonne réactivité du système et application monothreadée en arrière plan ». A partir de là, libre à vous d’imaginer quelles pourraient être ces applications en fonction de l’utilisation que vous faites de votre machine. Bien entendu afin de profiter au maximum du dual core dans le cadre d’une utilisation multitâche de ce type la puissance processeur ne fait pas tout : il faudra un minimum de mémoire vive (1 Go), et par exemple si les deux applications font régulièrement appel au disque il sera préférable d’avoir les fichiers de travail sur deux disques distincts. Lecture vidéo avec rendu 3D ou compression vidéo en arrière planPour ce premier test, pendant un rendu sous 3d studio max 7 (multi thread) ou un encodage vidéo DiVX sous Virtualdub (mono thread), nous effectuons la lecture au premier plan sous Windows Media Player 10 d’un film en DiVX à 1500 Kbits /s avec B-Frame (mono thread), puis la lecture d’un film en Windows Media Vidéo HD 720p (multi thread). Sont reportés les temps de rendu de base, avec le film DiVX au premier plan et avec le film WMV au premier plan, puis le ralentissement que cela entraîne. ![]() Première chose à noter, malgré le fait qu’elles soient au premier plan toutes les vidéos n’étaient pas forcément lues de manière fluide. Il nous a parfois fallu abaisser la priorité du rendu 3d via le gestionnaire de tache Windows, ce qui n’a rien de très pratique, la faute étant plus à attribuer à Windows qu’au processeur à proprement parler. Pour la vidéo DiVX, c’était le cas dès que plusieurs processeurs (logiques ou non) étaient présents, et pour la vidéo WMV HD c’était le cas sur tous les P4 mono core, avec HyperThreading ou non. ![]() 3ds studio max étant de base fort bien multithreadé et bien plus rapide sur processeur dual core, il voit ses performances baisser dans ce cas sur ce type de processeur, même si c’est dans une moindre mesure. Ceci permet encore de creuser l’écart entre processeurs simple et double core. ![]() Comme dans le premier test, il a parfois fallu baisser la priorité de virtualdub pour que la vidéo au premier plan soit fluide. Dans le cadre de l’encodage DiVX pendant la lecture d’un ... DiVX, ce fut d’ailleurs le cas pour tous les processeurs. Par contre, la lecture de WMV n’a pas posé de souci de ce type, exception faite des 3 processeurs sans dual core ou HyperThreading. Virtualdub n’étant que très peu multithreadé l’avantage est ici encore plus évident qu’avec 3d studio max. En effet, on ne mesure quasiment pas de baisse avec la lecture DiVX, et celle-ci est très légère avec la lecture WMV, le tout sur les CPUs AMD dual core. En simple core, le fait de lire une vidéo WMV HD pendant son encodage fait baisser les performances de 40% ... On notera qu’ici l’HyperThreading sur dual core Intel pose problème. Page 10 - Scénarios multitâches, suite Rendu 3D et compression vidéo en arrière plan, et vice-versaCette fois nous avons décidé d’aller plus loin en combinant le rendu 3d studio max 7 (multi thread) avec l’encodage DiVX sous VirtualDub (mono thread). Sont reportés la somme des temps nécessaires à la réalisation des deux tâches l’une après l’autre (le rendu étant 1.17 à 2.22x fois plus rapide de base que l’encodage selon le CPU), le temps global pour finir les deux tâches avec 3ds max au premier plan et le temps global avec virtualdub au premier plan. ![]() C’est à une exception près le couple encodage DiVX au premier plan / rendu 3d au second plan qui est le plus rapide. Par ailleurs, quand 3d studio est au premier plan, il est toujours le premier à finir, par contre quand c’est Virtual dub c’est variable : avec HyperThreading ou dual core, c’est 3ds qui termine en premier, et sans c’est Virtual dub. Par ailleurs, toujours sans HT et dual core, le fait de lancer les deux applications en parallèle ralentit légèrement le temps d’exécution global. Les gains les plus importants sont enregistrés sur les processeurs Intel dual core sans HT, ce dernier ayant ici un impact fort négatif sur ce type de processeur, la gestion de threads répartis sur les 4 processeurs logiques semblant poser problème sous Windows. Chez AMD les gains sont toutefois également plus que notables puisqu’on atteint tout de même 44% ce qui est loin d’être négligeable. En fait sur les processeurs dual core dans ce cas où l’application mono thread prend de base nettement plus de temps que la multi thread, le fait de lancer les deux tâches en même temps fait que l’ensemble de ces tâches s’effectue dans un temps comparable à celui pris pour la tâche mono thread seule. Jeu et compression vidéo en arrière planVoici notre dernier scénario multitâche, à savoir le jeu pendant une compression vidéo DiVX sous Virtual dub en arrière plan. Ce genre de chose est assez difficile à mesurer précisément dans tous les cas de figure, et nous couplerons donc des chiffres à proposer pour Pacific Fighters à un ressenti sous Far Cry. Pour Pacific Fighters, nous avons mesuré la moyenne du framerate obtenu dans notre replay habituel de 2 minutes sans rien derrière, puis avec la compression en arrière plan, et enfin en abaissant la priorité de Virtual dub d’un cran et en le forçant sur le CPU0 sur les CPU simple core, ceci afin d’obtenir un framerate plus élevé lorsque cela était nécessaire. Il faut noter que ce n´était pas le cas ici pour les processeurs dual core pour la simple et bonne raison que la compression DiVX sous Virtualdub n’est pas vraiment multithreadée. Lorsque c’est le cas pour la tache en arrière plan, il vous faudra alors soit baisser la priorité de cette tache en arrière plan multithreadée, soit attribué une affinité sur un des deux processeurs pour celle-ci, afin de ne pas voir vos les performances de la tache au premier plan (le jeu) baisser de manière trop importante. Une fois ces réglages effectués, comme dans le cas ci-dessous le jeu ne verra pas ses performances baisser notablement, et la tache multithreadée s’exécutera à la vitesse d’un des deux core, voir plus si le réglage de la priorité suffit et que le jeu n’utilise pas toujours le CPU à son maximum. Bien entendu ces informations ne seraient pas utiles sans une autre qui est l’avancement de la compression pendant la durée du replay. On reporte donc cet avancement après 2mn05s (temps de chargement du replay + replay) sans rien, après le replay, et après le replay avec l’affinité et la priorité de virtual dub réglées manuellement. ![]() La première chose à noter en observant la seconde colonne de résultats est que le framerate moyen, si il est d’habitude révélateur des performances et de la jouabilité, n’est l’est pas ici sur les processeurs simple core sans HyperThreading. En effet, malgré un framerate moyen assez élevé, le tout était très saccadé et injouable ! Malheureusement le chiffre de framerate le plus bas rapporté par FRAPS ne donne pas vraiment d’information sur ce phénomène puisqu’il s’agit d’un framerate le plus bas moyen sur une seconde. En effet si pendant un dixième de secondes on à 5 frames affichées après 0.02, 0.02, 0.02, 0.02 et 0.02 secondes d’un côté et 5 autres affichées après 0.01, 0.01, 0.06, 0.01 et 0.01 secondes, le chiffre rapporté par fraps sera identique alors que la sensation de fluidité sera meilleure dans le premier cas. Le dual core démontre ici tout son intérêt puisque le framerate dans le jeu ne baisse que très peu alors que l’avancement de la compression vidéo monothread en arrière plan a avancée dans les mêmes proportions qu’en laissant le PC inactif. Les processeurs mono core ne permettent bien entendu pas d’aller aussi loin. Sans HyperThreading c’est injouable sauf si l’on baisse la priorité de la compression … ce qui fait qu’elle n’avance plus alors d’un poil pendant le jeu. Cela reste tout de même encore injouable du fait d’une micro saccade toutes les 3-4 secondes. Seul l’HyperThreading permet d’avoir un framerate assez faible mais régulier avec un bon avancement de la tâche en arrière plan, ou un framerate plus élevé mais un avancement moindre en abaissant la priorité de l’encodage. Pour ce qui est nos observations sous Far Cry, elles sont similaires à ce que nous avons mesurés sous Pacific Fighters. Far Cry est donc complètement injouable sur un processeur mono core sans hyperthreading avec une tâche lourde lancée en arrière-plan, même si l’on abaisse sa priorité. Avec le dual core, c’est parfait ! Page 11 - Conclusion Conclusion ![]() La conception plus avancée du design dual core d’AMD, qui ne s’est pas contenté d’accoler deux cores, ne semble pas pour sa part apporter de gain de performance significatif en pratique, même si parfois le passage de 1 à 2 core apporte très légèrement plus chez AMD. En fait, ce qui permet vraiment au dual core AMD de se distinguer, c’est l’HyperThreading d’Intel … En effet, avec cette technologie Intel disposait d’un avantage notable dans le cadre du multitâche et du multithread sur les processeurs monocores. Avec le dualcore, l’HyperThreading n’est pas présent sur les Pentium D et apporte des gains comme des pertes sur Pentium Extreme Edition du fait de la gestion des threads sous Windows. Du coup, chez AMD le passage au dual core est plus intéressant que chez Intel ! Ceci permet notamment à AMD de reprendre les devants en terme de performances dans des domaines tels que le rendu 3D ou l’encodage vidéo, ou de réduire fortement l’écart de performances vis-à-vis d’Intel lorsque ce dernier était très important en monocore comme c’est le cas sous TMPGEnc. Si l’on ajoute à cela les excellentes performances des Athlon 64 dans les domaines ludiques et scientifiques, on peut se demander ce qu’il reste à Intel ? Les prix. En effet, fort de sa supériorité sur le dual core, AMD place ses nouvelles solutions sur le haut de gamme, à des prix variant entre 537 et 1001$, alors que chez Intel les tarifs varient entre 241 à 999$. On aurait clairement apprécié un ticket d’entrée plus bas chez AMD. Ceci permet à Intel de proposer un Pentium D 820 très intéressant si l’on a besoin de performance dans des applications fortement multi threadées : pour du rendu 3D par exemple, il n’y a pas mieux en rapport performance / prix. En contrepartie, ses performances en mono threading sont au niveau d’un P4 2.8 GHz, mais si vous n’avez pas besoin de puissance pour ce type d’application, est-ce important ? ![]() Si ce n’est pas le cas, étant donné le surcoût demandé par rapport à une solution doté d’un unique core à une fréquence similaire, il vaudra mieux passer votre chemin, en attendant la démocratisation de ces solutions qui devrait avoir lieu en 2006 du fait des baisses de prix qui seront possibles avec le passage en gravure 65nm et des logiciels multithreadés qui seront alors plus nombreux. Copyright © 1997-2025 HardWare.fr. Tous droits réservés. |