HardWare.fr


Dual core : Intel Pentium D & Extreme Edition 840
Processeurs
Publié le Lundi 18 Avril 2005 par Marc Prieur

URL: /articles/566-1/dual-core-intel-pentium-d-extreme-edition-840.html


Page 1 - Avant propos, Introduction

Avant propos
Vous le savez probablement si vous avez lu nos actualités, des tests des Pentium dual core ont déjà été publiés par nos confrères de la presse online américaine, anglaise ou encore allemande le 4 avril dernier. Mais pas en France. Pour une raison qui nous reste encore inconnue, Intel n’a pas cru bon de fournir les médias français en plates-formes de test pour ce lancement.

Aujourd’hui 19 avril, nous sommes enfin en mesure de vous fournir un tel article, mais nous tenons à vous donner les détails sur les conditions de ce test. Sachez que 3 médias online français ont dû se partager une même machine depuis jeudi, pour une date de publication des tests fixée à l’annonce officielle d’Intel soit hier. 4 jours, pour trois tests donc. Bien entendu, c’est déjà mieux que rien. Quoique ?

L’intérêt pour nous d’avoir ce type de matériel avant sa disponibilité dans le commerce, c’est de vous fournir dans les meilleurs délais un article détaillé sur le sujet, ce qui nous assure votre fidélité qui est notre raison d’être. L’intérêt pour Intel de prêter du matériel en test est d’avoir une visibilité auprès du public sur ses nouveaux produits, de préférence positive et au minimum, objective. Dans le cas qui nous occupe ce besoin d’Intel est encore plus important puisque cette annonce avancée de ses processeurs double core est clairement faite pour marquer l’esprit des gens et devancer AMD dans ce domaine, même si la disponibilité des produits ne suit pas vraiment.

A la vue de ses éléments, on peut se demander pourquoi Intel a décidé que les médias online français ne devaient pas avoir accès au premier jet de machines, et pourquoi un délai de test si court a été imposé à ces mêmes médias, même si nous avons préféré repousser la publication afin de multiplier les tests. Le public français n’aurait-il pas besoin d’être informé en même temps et aussi bien que les autres sur le dual core ? Les médias français ne seraient-ils pas objectifs ou assez complaisants (rayez la mention inutile) vis-à-vis d’Intel pour mériter autant d’attentions que les autres ? Bonnes questions ...
Introduction
C’est un fait, depuis quelques temps l’actualité du micro processeur PC n’a rien de très spectaculaire. Chez AMD tout d’abord, on n’a pas enregistré de gain de performances depuis maintenant 7 mois, alors que chez Intel les derniers processeurs de la gamme Pentium 4 6xx n’ont rien apporté de concret, le léger avantage leur étant conféré par leur cache L2 étant annulé par leur fréquence inférieure. Le deuxième semestre 2005 devrait toutefois être bien plus chargé en nouveautés, avec l’arrivée d’une innovation majeure pour les processeurs x86 : le dual core (double cœur).


Page 2 - Deux CPU en un, apport de deux CPU

Deux CPU en un
Le principe même du dual core est très simple, puisqu’il s’agit de disposer de deux processeurs complets, venant s’insérer dans un seul Socket. Ceci permet donc de doubler la puissance théorique d’un processeur, et ce sans en avoir à en augmenter sa fréquence ou son architecture, deux paramètres beaucoup plus complexes à améliorer. La contrepartie de cette relative facilitée se situe au niveau logiciel, mais nous y reviendrons plus tard.


Afin de faire un processeur dual core, plusieurs méthodes sont envisageables. La première, c’est ni plus ni moins d’intégrer chaque core au sein de deux dies distincts, eux-mêmes intégrés sur le packaging. La seconde est de graver ces deux cores sur un même die. C’est ce choix qu’a fait Intel pour le moment, en attendant le passage à la première pour les futurs dual core 65nm, ceci pour des raisons de coût (die moins gros = plus simple à produire).


Il existe enfin une troisième méthode, celle utilisée par AMD pour ses futurs processeurs Opteron et Athlon 64 bi-core. Cette fois le design est revu et corrigé et il ne s’agit plus de deux core simplement accolés sur un même die. Les processeurs AMD intégrant notamment leur propre contrôleur mémoire, celui-ci n’est pas dupliqué et les deux processeurs se le partagent en interne. C’est également en interne que se fait la communication directe entre les processeurs liés à la cohérence des caches des deux core.
Ce que le dual core améliore ...

En effet, pour qu’une application puisse exploiter deux processeurs ou core simultanément, il faut qu’elle soit écrite dans cette optique, c´est-à-dire multithreadée. Une telle application fera s’exécuter plusieurs de ses routines élémentaires (thread) en parallèle. En sus de toutes les applications serveurs, la majorité des applications multithreadées sont des applications destinées à une utilisation de type serveur ou station de travail. C’est notamment le cas de la plupart des logiciels d’image de synthèse, de montage et d’encodage vidéo.

Toutefois, rien n’est perdu pour les applications monothreadées, qui représentent une grande majorité des logiciels, et notamment la totalité des jeux hormis ceux basés sur le moteur de Quake 3, la programmation d’un jeu de manière multithread étant à priori une chose ardue. En effet le fait de disposer de deux processeurs permet d’avoir d’un système multitâche plus performant lorsque vous utilisez plusieurs applications monothreadées simultanément, le système d’exploitation se chargeant de répartir la charge entre les CPUs.

Le dual core apporte également deux énormes plus dans le cadre d’une utilisation serveur. Le premier, c’est la densité de core par U, qui est facilement augmentée, et le second, c’est le système de licence. En effet, même si tous les éditeurs ne sont pas encore passés à ce type de licence, Microsoft par exemple considère qu’un processeur dual core est en fait un unique processeur physique, et il ne nécessite donc qu’une licence mono processeur même si 2 à 4 thread (avec hyperthreading) peuvent être exécutés en parallèle.
... et ce qu’il n’améliore pas
Premier cas classique, l’utilisation d’une application monothread seule ne sera quasiment pas améliorée par le dual core, les seuls gains pouvant découler de la faible charge supplémentaire inhérente aux services du système d’exploitation ou aux drivers.

De plus, il ne faut pas perdre de vue que si le dual core permet de résoudre un goulot d’étrangement, à savoir le processeur, il ne s’agit pas non plus d’une potion magique. Ainsi, dans le cadre d’un multitâche intensif entre plusieurs applications faisant appel aux disques, ces derniers seront souvent un facteur limitant. Dans un tels cas, le fait de disposer de plusieurs disques durs travaillant indépendamment sera un plus non négligeable.

Enfin, si le dual core permet d’exécuter simultanément plusieurs taches lourdes, il ne faut pas oublier la mémoire vive qui va avec, sans quoi les gains seront réduits du fait de l’utilisation du swap disque.


Page 3 - L'Intel SmithField

L’Intel SmithField
Le Pentium Extreme Edition 3.2 GHz annoncé hier (999$), et les Pentium D 2.8, 3.0 et 3.2 GHz qui seront annoncés fin mai (241, 316 et 530$) partagent un design commun dénommé SmithField. Seule différence, alors que l’Extreme Edition supporte l’HyperThreading, soit un total de 4 processeurs logiques, le Pentium D en est dépourvu.


Le design utilisé par Intel est simple voir simpliste puisque chaque core est doté de sa propre interface de bus afin de communiquer l’un après l’autre avec le reste de la machine via le chipset et son front side bus (FSB). Cette fois, lorsque les deux core ont besoin de communiquer, on a l’obligation de passer par le chipset de la carte mère, comme c’est le cas d’une véritable configuration bi-processeur chez Intel.


Les deux cores sont très similaires à celui d’un Pentium 4 Prescott 90nm à 1 Mo de cache L2, et au total ce ne sont pas moins de 230 millions de transistors qui sont contenus dans le CPU ! Côté FSB, on retrouve un FSB800 classique offrant une bande passante de 6.4 Go /s qu’il faudra cette fois partager entre deux core. Pourquoi pas un FSB1066 comme sur les précédents Extreme Edition par exemple ?

Tout simplement parce que Intel a utilisé un (ou plutôt deux) core Prescott, et que ce dernier ne peut descendre en dessous d’un coefficient multiplicateur de x14 : 14x266 MHz = 3.72 GHz, cela fait un peu trop pour le moment pour un processeur dual core. Le codage du multiplicateur devrait être revu sur les prochains processeurs dual core 65nm prévus pour début 2006, ce qui permettra d’utiliser un FSB commun plus élevé.

Côté dissipation thermique, Intel annonce pour ce processeur un Thermal Design Power de 130 Watts. Il faut rappeler qu’un TDP de 130 watts signifie que selon Intel il faut un refroidissement capable de dissiper 130 watts afin d’assurer une fiabilité sur le long terme au processeur et au système. Il ne s’agit pas de la consommation maximale de ce processeur puisqu’il est possible que le processeur consomme et dissipe plus dans des cas extrêmes et dans ces conditions le Thermal Monitoring rentrera donc en action si la ventilation n’est pas suffisante. A titre de comparaison, sur les Pentium 4 les plus hautement cadencés on est à 115 Watts, contre 84 Watts pour un Pentium 4 540 à 3.2 GHz.

Côté plate-forme, les processeurs dual core sont malheureusement incompatibles avec les cartes mères Socket 775 actuelles sans modification matérielle. Si le processeur reste au format Socket 775, plusieurs pins auparavant inutilisés le sont désormais, et d’autres sont utilisées à d’autres fins. Voici une liste des changements pour les plus curieux :

H1 GTLREF => GTLREF0 ; H2 FC6 => GTLREF1 ; G2 FC1 => COMP2 ; R1 FC2 => COMP3 ; E24 RSVD => FC10 ; Y3 RSVD => FC17 ; AE3 RSVD => FC18 ; B13 RSVD => FC19 ; E5 RSVD => FC20 ; J3 RSVD => FC22 ; D23 RSVD => VCCPLL ; AK6 RSVD => FORCEPR# ; F6 RSVD => IMPSEL.


Page 4 - Un nouveau chipset

Un nouveau chipset
Quitte à nécessiter de nouvelles cartes mères, ce qui ne devrait pas être le cas des Athlon 64 X2, autant sortir un nouveau chipset. C’est ainsi que Intel propose avec son Pentium Extreme Edition 840 l’i955X, le successeur de l’i925XE. Lors de la sortie des Pentium D fin mai, on devrait également voir arriver l’i945P, qui succédera pour sa part à l’i915P.

Les nouveautés apportées par le MCH82955X se situent uniquement au niveau de la mémoire. D’une part, celle-ci peut désormais être de type DDR2-667 (même si les gains sont plus que minimes en pratique), contre DDR2-533 auparavant, et d’autre part le chipset peut désormais gérer 8 Go de mémoire, contre 4 Go auparavant. Le bus processeur est toujours de type FSB800 ou 1066, et le chipset gère 16 lignes PCI-Express attribuables à un port graphique du même type. La liaison à l’ICH se fait toujours via un bus DMI offrant une bande passante de 1 Go /s dans chaque sens.


De l’ICH6, on passe désormais à l’ICH7. La première nouveauté se situe au niveau du PCI Express puisque l’on passe de 4 à 6 lignes, mais ce uniquement pour l’ICH7R, l’ICH7 restant limité à 4. Les 4 premières lignes sont configurables en 4 ports x1 ou un port x4, alors que les deux autres doivent être utilisés pour deux ports x1. Côté Serial ATA, on reste à 4 ports mais ils sont désormais de type SATA-300 (300 Mo /s par canal, contre 150 auparavant). Sur la version R, l’AHCI, qui permet de gérer le Native Command Queuing, est bien entendu au rendez-vous ainsi que l’Intel Matrix Storage, qui gère le Matrix RAID ainsi que les RAID 0, 1, 10 et – c’est nouveau – le RAID 5.

Comme l’ICH6, il intègre un contrôleur réseau 10/100 Mbits, gère 8 ports USB2, un unique canal Ultra ATA 100 et accepte les CODECs audio de type AC’97 2.3 ou High Definition Audio. On notera que si l’ICH6 permettait de gérer jusqu´à 7 périphériques PCI, ce nombre descend à 6 sur l’ICH7. On s’en remettra.

Les premières cartes mères à base de chipset i955X devraient être disponibles début avril / fin mai, soit bien avant qu’un seul Pentium Extreme Edition 840 pointe le bout de ses pins dans les canaux de distributions classiques.


Page 5 - En pratique

En pratique
Pour ce test, Intel nous a fournis une carte mère i955X de sa fabrication, la D955XBK.


Assez complète en terme de fonctionnalité, elle dispose en sus du chipset i955X et du southbridge ICH7R de quelques puces additionnelles :

- Une puce SATA RAID (4 ports) Silicon Image
- Une puce FireWire 800 Texas Instrument
- Une CODEC HD Audio SigmaTel
- Un contrôleur réseau Intel Gigabit

Du côté des cartes d’extensions, on notera la présence de deux ports PCI Express x16. En fait, le premier est câblé tel quel, alors que le second fonctionne est câblé en x4 au niveau du signal, soit 1 Go /s dans chaque sens. Il est à priori géré par l’ICH7R et permet donc d’accueillir une seconde carte graphique dans le but de pouvoir gérer 4 écrans, ou d’augmenter les performances graphiques via le SLI de NVIDIA ou le futur AMR d’ATI. Toutefois, pour le moment les drivers NVIDIA ne semblent pas autoriser l’activation du SLI sur un chipset Intel 955X. Côté alimentation, on retrouve un connecteur ATX 2x12 pins, un connecteur ATX12V 2x4 pins et un connecteur type Molex. Ce dernier n’est utile que si l’on utilise deux cartes graphiques PCI-Express, alors que l’utilisation d’un connecteur d’alimentation ATX12 8 pins n’est pas obligatoire, un 4 pins classique étant à priori suffisant à son office.


Intel nous a également fournit un Pentium Extreme Edition 840 Socket 775 cadencé à 3.2 GHz, et le ventirad qui va avec. Si le ventilateur ne change pas (un Nidec à 2580 tpm) et est donc loin d’être silencieux, la base est revue est corrigée puisque l’insert cuivre est d’une taille plus importante et que les ailettes sont désormais plus nombreuses. La carte mère permettant de désactiver l’HyperThreading, nous avons pu également tester ce qui sera le Pentium D 840, puisqu’il s’agit de l’unique différence entre ces processeurs.


Comme vous pouvez le voir, Windows XP reconnaît bien les deux cores hyperthreadés, soit un total de 4 processeurs logiques. En théorie, la répartition est la suivante :

- CPU 0 & 2 : Deux processeurs logiques du 1er core
- CPU 1 & 3 : Deux processeurs logiques du 2nd core

En pratique, nous avons pu verifier si c’était le cas à l’aide de ThreadTest, un outil développé par Julien Houllier  que nous remercions et qui permet de lancer divers calculs sur les différents processeurs du système. Voici les résultats obtenus, exprimés en millions d’opérations par seconde, pour un calcul sur des entiers 64 bits :


Comme vous pouvez le voir, les chiffres les plus faibles avec deux threads lancés sur deux processeurs sont obtenus avec les combinaisons CPU0 + CPU2 et CPU1 + CPU3, ce qui vient confirmer la répartition théorique. Dans ces conditions idéales ont remarquera que les gains vont tout simplement du simple au double entre un thread et deux thread si ils sont exécutés sur les bons processeurs.

Nous avons également mesuré la consommation de la configuration en charge sous Prime 95, avec plusieurs sessions de Prime95 si nécessaire pour charger le processeur à 100%. Il s’agit de la consommation de la totalité de la configuration (carte mère, 2x512 Mo de mémoire DDR2, X850 XT PE, 2 Raptor). La mesure étant effectuée à la sortie de la prise de courant, la consommation réelle de la configuration est donc moindre puisque le rendement d’une alimentation est de 70 à 80%.


Sur le bureau Windows et au repos, avec un processeur dual core on consomme autant qu’avec un P4 EE 3.73 GHz, et 15 watts de plus que l’équivalent simple core qui est le P4 540. Avec une instance de Prime95, le dual core se situe à peu près au niveau du Pentium 4 660, avec un écart par rapport au simple core de 28-29 Watts. Logiquement, dès que l’on utilise deux instances de Prime95 la consommation est clairement au désavantage du dual core, qui offre bien entendu des performances bien plus importantes dans ce type de configuration. Le paroxysme est atteint avec 4 Prime95 sur le Pentium Extreme Edition 840.

On notera d’ailleurs une différence de 50 watts entre ce processeur et le maximum obtenu avec le Pentium 4 EE 3.73 GHz. Certes, il faut prendre en compte le rendement de l’alimentation de la machine ou encore celui du bloc d’alimentation processeur de la carte mère, mais ont est tout de même loin des 15 watts qui séparent les TDP officiels de ces deux processeurs. Côté température, le processeur flirte avec les 70°C en charge maximale, ce qui est limite.


Il faut noter que notre processeur de test n’était pas bridé au niveau du coefficient multiplicateur, que ce soit vers le bas – une habitude pour un processeur de test – mais aussi vers le haut, ce qui est plus étonnant. Nous avons pu ainsi sans problème booter à 4 GHz en 20x200 MHz sans modifier la tension initiale de 1.4V. Toutefois, à cette fréquence on consomme déjà rien que sous le bureau Windows 54 Watts de plus qu’a 3.2 GHz, et la température mesurée via le monitoring du bios est à 76°C. Tout test de charge entraîne l’activation de la protection thermique et le ralentissement du processeur. L’overclocking du dual core est possible, mais il nécessitera un refroidissement à eau de bonne facture étant donné la chaleur à dissiper pour un seul Socket.


Page 6 - Le test

Le test
A titre de comparaison nous avons inclus dans notre protocole de test les processeurs suivants :

- Intel Pentium 4 540 à 3.2 GHz
- Intel Pentium 4 540 à 3.2 GHz avec HyperThreading désactivé

Ceci dans le but de comparer l’apport du dual core chez Intel à architecture et fréquence équivalente.

- Intel Pentium 4 Extreme Edition 3.73 GHz
- Intel Pentium 4 660 3.6 GHz

Afin de comparer les processeurs dual core haut de gamme aux processeur “standards” haut de gamme.

- Athlon 64 FX-55
- Athlon 64 4000+

Soit, à titre d’information, les deux processeurs les plus haut de gamme de chez AMD. Les configurations utilisées étaient les suivantes :

Intel Socket 775 :
- Carte mère D955XBK
- ATI Radeon X850 XT PE
- 2 x 512 Mo DDR2-667 4-4-4
- 2 x Raptor 74 Go
- Windows XP SP2 Français

AMD Socket 939
- Carte mère ASUS A8N SLI
- ATI Radeon X850 XT PE
- 2 x 512 Mo DDR-400 2-2-2
- 2 x Raptor 74 Go
- Windows XP SP2 Français

Pour ce test, nous avons modifié notre suite logicielle utilisée en des points que nous détaillerons pour chacun des tests. Les résultats ne sont donc pour la plupart pas directement comparables avec ceux obtenus dans des comparatifs précédents.


Page 7 - 3d studio max 7, Maya 6

3d studio max 7
Pour 3d studio max, nous effectuons le rendu via le moteur de rendu interne de 3ds (scanline) d’une scène mise au point par Studio PC qui fait fortement appel à la radiosité, la première scène un peu vieillotte aillant été abandonnée. Ce type de rendu plus très réaliste au niveau des éclairages est aussi plus lent, et 80% du temps de rendu est passé sur ce type d’effet au sein de cette scène.


Comme tous les logiciels de rendu 3D, 3ds max 7 se régale de la présence de plusieurs processeurs. Rien que la présence de l’HyperThreading permet d’apporter, sur simple comme sur dual core, un gain de 22%. Avec deux core on est 73% plus rapide qu’avec un core avec HyperThreading équivalent.

Au final un Pentium Extreme Edition 840 est 50% plus rapide qu’un Pentium Extreme Edition 3.73 GHz, écart qui est réduit à 27% lors de la comparaison entre Pentium D 840 et Pentium 4 660, qui sont à des zones tarifaires proches.
Maya 6
Nous n´avons pas utilisé le moteur de rendu Maya Software, dont le développement a été clairement mis de côté par Maya du fait de l’intégration du moteur de rendu Mental Ray, pour ce dernier. Nous utilisons une scène mise au point par Yann Dupont de 3DVF que nous remercions.


Si l’HyperThreading apporte un gain non négligeable de 22% en mono core, les choses se compliquent dans le cadre du dual core. En effet, on assiste à une baisse de performance non négligeable et on est alors 7% plus performant sans HyperThreading ! Contrairement à ce qui se passe sous 3ds max, il semble que seuls deux thread soient utilisés ici et leurs répartition sur les 4 processeurs logiques ne semble pas se faire au mieux. On notera par contre le gain très important lorsque l’on passe d’un core à 3.2 GHz sans HT à deux core à 3.2 GHz sans HT : +96% !

Le Pentium D 840 s’avère au final 43% plus rapide qu’un Pentium 4 660, cette différence n’étant plus « que » de 30% entre les deux Extreme Edition du fait de ce bug lié à l’HyperThreading. Bien entendu il est possible de forcer l’affinité de Maya sur les CPU0 et 1 via le gestionnaire de tâches Windows ce qui résout le problème, mais cela n’a rien de très pratique d’autant qu’il faut le faire dès qu’on lance l’application.


Page 8 - Mathematica 5.1, WinRAR 3.5

Mathematica 5.1
Voici venu l’heure des calculs scientifiques, avec Mathematica de Wolfram Research. Nous sommes passés à la version 5.1 du logiciel, tout en conservant la suite de test développée par Stefan Steinhaus.


Comme vous pouvez le voir, de base Mathematica ne tire pas partie de plusieurs processeurs pour les calculs effectués dans cette suite de test. Pour se faire, il faudrait en fait effectuer les calculs en parallèle sous deux Kernels de Mathematica, soit à la main, soit avec un programme dédié qui utilisant l’API MathLink pour gérer plusieurs Kernels en parallèle.

Sans cela, comme vous pouvez le voir les résultats sont clairement en défaveur du dual core puisqu’ils arrivent au niveau d’un processeur simple core et sont donc désavantagés par leur fréquence inférieure.
WinRAR 3.5
Un total de 588 Mo de fichiers, répartis en 493 fichiers Word & Excel (69 Mo), 22 fichiers de boite e-mail Eudora (251 Mo) et 1 fichier audio au format wav (268 Mo), sont compressés via WinRAR 3.5 en utilisant la compression la plus poussée.


L’avantage de ce test est d’être très dépendant des performances du couple chipset + mémoire, son désavantage est de ne pas être multithread. Le léger gain que l’on remarque entre le P4 540 avec et sans HT est en fait lié à la charge liée de lecture / écriture sur le disque, qui peut être fait en parallèle. Toutefois elle ne consomme pas non plus beaucoup de temps processeur, d’où des gains très limité.

Le dual core n’a ici pas d’intérêt, surtout à une fréquence de « seulement » 3.2 GHz.


Page 9 - TMPGEnc 3, Vdub + DiVX 5

TMPGEnc 3.0 Xpress
Sous TMPGEnc, désormais en version 3.1.5.8, nous encodons un fichier DV de 10 minutes 16 secondes au format MPEG-2, en 720x576 avec un bitrate moyen de 4500 kbits /s et en 2 passes. L’affichage de la vidéo en mode preview est désactivé pendant ce test.


Particulièrement optimisé pour le multi thread mais aussi pour le SSE (version 3 incluse), TMPGEnc ne montre pas les Athlon 64 sous leur meilleur jour. Il en va autrement des processeurs Intel, avec ne serait-ce que du fait de l’HyperThreading des gains respectifs de 29% et 20% en mono et dual core. Sans HT, l’apport du dual core est de +90%, et avec de +77%.

Au final le Pentium Extreme Edition 840 est 54% plus rapide que le Pentium 4 EE 3.73 GHz, cet écart étant réduit à 33% entre PD 840 et P4 660.
DiVX 5.2.1 & VirtualDub 1.6.5
VirtualDubMod, dont le développement est en retard sur VirtualDub, est abandonné au profit de ce dernier en version 1.6.5. Nous compressons la même vidéo que sous TMPGEnc en mode Fast recompress et via le codec DiVX 5.2.1 en une passe avec un bitrate moyen de 1500 kbits /s, b-frame et performance d’encodage standard. L’affichage de la vidéo en mode preview est désactivé pendant ce test.


Virtualdub est multithreadé , mais pas pour l’encodage vidéo à proprement parlé : il dispose d’un thread pour l’interface utilisateur, d’un pour les I/O, d’un pour les preview et enfin d’un dernier pour le processing. Toutes les opérations de vidéos sont toutefois effectuées en série au sein ce dernier thread, ce qui explique ici l’absence de gain notable lié au dual core, DiVX ne semblant pas non plus paralléliser l’encodage pur et dur. Dans le cadre d’un dual core, nous vous conseillons donc plutôt d’utiliser FlaskMPEG ou XMPEG, qui sont certes moins fonctionnels mais qui par contre savent mieux tirer partie d’un système dual core.


Page 10 - Far Cry, Pacific Fighters

Far Cry
Voici maintenant des performances dans des applications plus ludiques avec pour commencer Far Cry. Pas de changement majeur si ce n’est une légère modification de la scène de test qui est constituée d’un parcours sur la map training en exterieur, et l’utilisation d’une carte ATI. En effet nous avons remarqué que sur certains chipsets, avec certaines révisions de drivers NVIDIA dans ce type de scène assez lourd côté processeur les performances étaient parfois assez bizarres.


Les jeux ne sont pas multithreadés, et ne devraient pas l’être majoritairement avant longtemps étant donné que cela est relativement difficile à faire. Selon EPIC , qui travaille sur l’Unreal Engine 3 qui sera multithreadé, un tel code demande 2 à 3 fois plus de temps de développement et ce n’est qu’a partir de fin 2006 que l’on devrait voir débarquer des jeux et des moteurs tirant pleinement partie d’un processeur dual core.

Du coup, les performances dans Far Cry ne s’améliorent pas du tout et sont du niveau de ce que propose un Pentium 4 540 classique. Un Pentium 4 mono core plus hautement cadencé, ou mieux un Athlon 64, est ici clairement plus avantageux !
Pacific Fighters
Pas de changements importants pour Pacific Fighters si ce n’est le passage à la version 3.04, et l’utilisation d’une carte ATI.


Comme sous Far Cry on ne note pas de gain notable lié à l’augmentation du nombre de core, et les performances des dual core sont donc en retrait du fait de leur fréquence inférieure. Même si beaucoup de jeux sont comme Far Cry nettement plus rapide sur Athlon 64 que sur Pentium 4, on peut voir ici que ce dernier s’en tire ici plutôt bien.


Page 11 - Scénarios multitâches

Scénarios multitâches
Nous vous en parlions dès la page 2, il existe deux moyen pour tirer partie d’un bi processeur, qu’il se fasse via deux Socket ou un seul. Les applications multi thread d’une part, mais également le multitâche d’autre part. Si l’introduction de l’HyperThreading chez Intel a notablement amélioré la réactivité du système lorsque l’on continue à l’utiliser malgré un traitement lourd, le dual core permet d’aller encore plus loin. Afin de mettre en évidence ceci nous avons effectués plusieurs tests :

- Lecture vidéo avec rendu 3D ou compression vidéo en arrière plan
- Rendu 3D et compression vidéo en arrière plan, et vice-versa
- Jeu et compression vidéo en arrière plan

Ces scénarios sont à prendre comme tels, c´est-à-dire comme une utilisation intensive de la machine. Tout le monde n’a pas besoin d’en faire autant, d’autant que ce type d’utilisation n’est pas habituel pour la majorité d’entre nous, mais qui peut le plus peut le moins et l’avantage du bi processeur et donc du dual core est normalement de pouvoir supporter ce type de charge.

Il faut également noter que l’extrapolation à partir de ces scénarios est tout à fait possible et même conseillée. Par exemple, le dernier scénario n’est pas simplement un scénario « Jeu et compression vidéo en arrière plan », c’est avant tout un scénario « Application monothreadée en premier plan nécessitant une très bonne réactivité du système et application monothreadée en arrière plan ». A partir de là, libre à vous d’imaginer quelles pourraient être ces applications en fonction de l’utilisation que vous faites de votre machine.

Bien entendu afin de profiter au maximum d’une utilisation dans le cadre d’une utilisation multitâche de ce type la puissance processeur ne fait pas tout : il faudra un minimum de mémoire vive (1 Go), et par exemple si les deux applications font régulièrement appel au disque il sera préférable d’avoir les fichiers de travails sur deux disques distincts.
Lecture vidéo avec rendu 3D ou compression vidéo en arrière plan
Pour ce premier test, pendant un rendu sous 3d studio max 7 (multi thread) ou un encodage vidéo DiVX sous Virtualdub (mono thread), nous effectuons la lecture au premier plan sous Windows Media Player 10 d’un film en DiVX à 1500 Kbits /s avec B-Frame (mono thread), puis la lecture d’un film en Windows Media Vidéo HD 720p (multi thread). Sont reportés les temps de rendu de base, avec le film DiVX au premier plan et avec le film WMV au premier plan, puis le ralentissement que cela entraîne.


Première chose à noter, malgré le fait qu’elles soient au premier plan toutes les vidéos n’étaient pas forcément lues de manière fluide. Il nous a parfois fallu abaisser la priorité du rendu 3d via le gestionnaire de tache Windows, ce qui n’a rien de très pratique, la faute étant plus à attribuer à Windows qu’au processeur à proprement parler. Pour la vidéo DiVX, c’était le cas dès que plusieurs processeurs (logiques ou non) étaient présents, et pour la vidéo WMV HD c’était le cas sur tous les P4 mono core, avec HyperThreading ou non.


3ds studio max étant de base fort bien multithreadé et bien plus rapide sur processeur dual core, il voit ses performances baisser dans ce cas sur ce type de processeur, même si c’est dans une moindre mesure. Ceci permet toutefois de creuser l’écart par rapport à un processeur mono core. Ainsi, le Pentium EE 840, qui était 36% plus rapide dans ce rendu, est désormais 65% plus rapide si ce rendu est effectué pendant la lecture d’un film WMV au premier plan.


Comme dans le premier test, il a parfois fallut baisser la priorité de virtualdub pour que la vidéo au premier plan soit fluide. Dans le cadre de l’encodage DiVX pendant la lecture d’un ... DiVX, ce fut d’ailleurs le cas pour tous les processeurs. Par contre, la lecture de WMV n’a pas posé de souci de ce type, exception faite des 3 processeurs sans dual core ou HyperThreading.

Comme vous pouvez le voir, l’HyperThreading sur dual core pose ici un problème, puisque le Pentium D est 5% plus rapide que le Pentium EE sur l’encodage DiVX. En dehors de cela, on remarquera tout de même que le temps d’encodage, qui est pour rappel mono thread, ne varie pas beaucoup sur les processeurs dual core pendant la lecture au premier plan d’une vidéo. Ce n’est pas vraiment le cas des autres processeurs, la charge liée à cette tache étant en grande partie impactée sur le temps de compression, même si on peut voir que l’HyperThreading permet de réduire ce phénomène sur l’architecture Netburst.


Page 12 - Scénarios multitâches, suite

Rendu 3D et compression vidéo en arrière plan, et vice-versa
Cette fois nous avons décidé d’aller plus loin en combinant le rendu 3d studio max 7 (multi thread) avec l’encodage DiVX sous VirtualDub (mono thread). Sont reportés la somme des temps nécessaires à la réalisation des deux taches l’une après l’autre (le rendu étant 1.17 à 2.22x fois plus rapide de base que l’encodage selon le CPU), le temps global pour finir les deux taches avec 3ds max au premier plan et le temps global avec virtualdub au premier plan.


C’est à une exception près le couple encodage DiVX au premier plan / rendu 3d au second plan qui est le plus rapide. Par ailleurs, quand 3d studio est au premier plan, il est toujours le premier à finir, par contre quand c’est Virtual dub c’est variable : avec HyperThreading ou dual core, c’est 3ds qui termine en premier, et sans c’est Virtual dub. Par ailleurs, toujours sans HT et dual core, le fait de lancer les deux applications en parallèle ralentis légèrement le temps d’exécution global. Les gains sont notables en HyperThreading, mais c’est tout particulièrement le Pentium D 840 qui profite de ce scénario. Au contraire, la gestion de thread sur le Pentium EE 840 semble une fois de plus poser problème sous Windows et il s’avère du coup nettement plus lent avec l’HT activé.
Jeu et compression vidéo en arrière plan
Voici notre dernier scénario multitâche, à savoir le jeu pendant une compression vidéo DiVX sous Virtual dub en arrière plan. Ce genre de chose est assez difficile à mesurer précisément dans tous les cas de figure, et nous couplerons donc des chiffres à proposer pour Pacific Fighters à un ressenti sous Far Cry.

Pour Pacific Fighters, nous avons mesuré la moyenne du framerate obtenu dans notre replay habituel de 2 minutes sans rien derrière, puis avec la compression en arrière plan, et enfin en abaissant la priorité de Virtual dub d’un cran et en le forçant sur le CPU0 sur les CPU HT et/ou Dual core, ceci afin d’obtenir un framerate plus élevé dans ce cas. Bien entendu ces informations ne seraient pas utiles sans une autre qui est l’avancement de la compression pendant la durée du replay. On reporte donc cet avancement après 2mn05s (temps de chargement du replay + replay) sans rien, après le replay, et après le replay avec l’affinité et la priorité de virtual dub réglés manuellement.


La première chose à noter en observant la seconde colonne de résultats, c’est que le framerate moyen, si il est d’habitude révélateur des performances et de la jouabilité, n’est l’est pas ici sur les processeurs simple core sans HyperThreading. En effet, malgré un framerate moyen assez élevé, le tout était très saccadé et injouable ! Malheureusement le chiffre de framerate le plus bas rapporté par FRAPS ne donne pas vraiment d’information sur ce phénomène puisqu’il s’agit d’un framerate le plus bas moyen sur une seconde.

En effet si pendant un dixième de secondes on à 5 frames affichées après 0.02, 0.02, 0.02, 0.02 et 0.02 secondes d’un côté et 5 autres affichées après 0.01, 0.01, 0.06, 0.01 et 0.01 secondes, le chiffre rapporté par fraps sera identique alors que la sensation de fluidité sera meilleure dans le premier cas.

Grâce à l’HyperThreading, les Pentium 4 mono core permettent de jouer, avec un framerate qui est bien entendu bien inférieur à ce qu’ils savent faire normalement et qui sera loin de contenter un hardcore gamer mais qui a l’avantage d’être très stable. Le Pentium D tire ici particulièrement son épingle du jeu puisque par rapport à un processeur mono core de même architecture et à la même fréquence il permet d’avoir un framerate 64% supérieur tout en étant 61% plus rapide sur l’encodage. L’écart est bien entendu moins important par rapport au Pentium 4 plus hautement cadencés, mais il reste plus que notable avec +29 et +32% par rapport au 3.73 GHz EE.

Après avoir réglé manuellement la priorité, voir l’affinité, de VirtualDub, afin d’obtenir un meilleur framerate les résultats changent complètement. Les processeurs mono core dépourvus d’HT affichent un framerate très proche du standard... ce qui s’explique de part l’avancement sous VirtualDub : 0%, tout simplement ! Malgré cette non progression, le jeu était par ailleurs tout de même rendu peu jouable du fait d’une micro saccade toutes les 3-4 secondes. Avec HyperThreading ou Dual core, on obtient cette fois des framerate similaires, mais des avancements de compression très disparates : avec un P4 660 vous aurez le même framerate qu’avec un PD 840, mais avec un encodage 3x plus lent !

Enfin, il faut noter qu’une fois de plus la gestion des thread ne semble pas optimale sur le Pentium Extreme Edition, le Pentium D affichant un framerate moyen et une vitesse d’encodage supérieurs dans ce scénario.

En ce qui concerne nos observations sous Far Cry, elles sont similaires à ce que nous avons mesurés sous Pacific Fighters. Far Cry est donc complètement injouable sur un processeur mono core sans hyperthreading avec une tâche lourde lancée en arrière plan. Même en abaissant la priorité de cette tâche, une micro saccade (saut d’une image ou deux) toutes les 3-4 secondes persiste.


Page 13 - Conclusion

Conclusion
L’arrivée du dual core pour les PC de bureau, dont Intel s’est voulu précurseur malgré une disponibilité qui devrait être plus que limité dans les deux mois à venir, signe le grand retour des solutions « bi processeur » abordables. En effet, après de timides apparitions via l’ABIT BP6, qui permettait de coupler deux Celeron Socket 370, ou encore les Athlon qui pouvaient se transformer en Athlon MP, le bi processeur était devenu hors de portée de la bourse du commun des mortels avec l’arrivée des Xeons dérivés du Pentium 4 et autres Opterons.

Malgré les années qui passent, nos remarques datant de ces précédentes solutions ne changeront guère : ce type de plate-forme est à réserver aux mordus d’applications qui sont d’ores et déjà conçues pour tirer partie d’un système multi processeur, comme c’est le cas des logiciels d’images de synthèse ou encore de nombreux logiciels de traitement vidéo, ainsi qu’aux fanatiques du multi tache intensif. Vous voulez par exemple pouvoir jouer pendant un encodage vidéo ou un rendu 3D ? Alors le dual core est fait pour vous.

Dans les autres cas, passez votre chemin et optez sans regrets pour un processeur mono core qui sera au choix moins cher et du même niveau de performance en mono thread ou au même prix et plus performant. Même dans le cadre d’un multitâche léger, par exemple le surf sur Internet pendant une tâche lourde, le simple core couplé à la technologie HyperThreading permet d’apporter la réactivité nécessaire au système pour un confort d’utilisation approprié. Les Athlon 64, qui sont dépourvus de cette technologie, profiteront d’ailleurs bien plus de l’arrivée d’un second core. Bien entendu cette situation n’est pas figée, et la démocratisation de ce type de processeurs devrait entraîner la multiplication des applications capables d’en tirer partie, et de ce fait rendre cette solution plus attractive. On n’en est toutefois pas là et il sera toujours temps de passer au dual core quand ce sera le cas.

Si l’on s’écarte de l’aspect technologique pour en revenir aux produits, et plus particulièrement à celui annoncé hier à savoir le Pentium Extreme Edition 840, on peut avoir plusieurs regrets. En sus de la disponibilité douteuse, de l’incompatibilité avec les cartes mères actuelles, de la dissipation thermique importante et des prix toujours astronomiques des Extreme Edition (999$), il faut rajouter au cahier des doléances un HyperThreading qui apporte des gains comme des baisses de performances, selon les logiciels et les combinaisons. Certes, cela semble en partie lié à Windows, mais en attendant les résultats sont là.

Si le dual core Intel à pour vous un intérêt étant donné l’utilisation que vous faites ou que vous comptez faire de votre machine, et si par le plus grand des hasards vous trouvez un Pentium Extreme Edition 840 en magasin, nous vous conseillons donc de passer votre chemin. Cette onéreuse démonstration technologique n’a en effet pas grand intérêt face aux Pentium D qui devraient être lancés fin Mai et qui seront nettement moins chers. Ces derniers devraient enfin rendre le bi processeur abordable pour tous ... sans toutefois le rendre utile pour toutes les utilisations. Reste qu’à terme et avec la démocratisation des logiciels multithreadés, il ne fait pas de doutes que le dual core deviendra incontournable pour un processeur x86.


Copyright © 1997-2024 HardWare.fr. Tous droits réservés.