HardWare.fr


AMD Phenom 9600
Processeurs
Publié le Lundi 19 Novembre 2007 par Marc Prieur

URL: /articles/694-1/amd-phenom-9600.html


Page 1 - Introduction



Lancés en septembre 2003, les Athlon 64 furent un véritable succès. AMD disposait en effet d’une architecture diablement efficace face à son rival Intel, que ce soit en terme de performance pure ou de rapport performance / consommation, un facteur qui commençait à prendre de l’importance. AMD continua sur sa lancée avec les Athlon 64 X2, soit une version dual core, qui ont vu le jour en mai 2005.

La réaction d’Intel fût longue, puisqu’il aura fallu 3 ans pour voir arriver les Core 2 qui ont débarqués l’été dernier. Mais la réaction était au niveau de l’attente puisque Intel propose depuis une architecture qui ne souffre pas de vrais défauts et affiche des performances de premier ordre malgré une consommation réduite. Le géant de Santa Clara a même enfoncé le clou en lançant il y’a un an le premier processeur x86 quad core, le QX6700.

Un an plus tard, AMD arrive enfin avec sa réponse à l’offre quad core d’Intel : les Phenom, qui sont basés sur l’architecture K10 que nous avons déjà détaillée le long de cet article. Ce délai n’était bien entendu pas celui initialement prévu, puisque l’an passé il était plutôt question de mi-2008, et qu’il y’a encore 6 mois il était question du troisième trimestre.
Un quad core « natif »
Composé de 463 millions de transistors, le processeur AMD Phenom intègre 4 cores. Chacun est doté de 128 Ko de cache L1, comme c’était le cas sur Athlon 64, et de 512 Ko de cache L2. En sus, ces cores disposent d’un cache de troisième niveau d’une capacité de 2 Mo.

AMD met en avant le caractère « natif » de son quad core, à contrario de l’offre Intel. En effet, un certains nombres de caractéristiques concernent les quatres cœurs dans leur ensemble, plutôt que deux par deux comme c’est le cas pour le Core 2 Quad. C’est notamment le cas du cache L3, et contrairement à Intel le processeur est composé d’un unique die de silicium.


AMD et Intel étaient déjà dans la même position lors du lancement des premiers processeurs dual core, et l’avantage du « natif » ne s’était alors pas vraiment fait ressentir dans une configuration desktop : les gains entre 1 et 2 cores étaient très proches sur les deux architectures de l’époque.

La gestion des rebuts qui en découle est par contre assez différente : Intel assemble deux dies de 143mm² (65nm) ou 107mm² (45nm) pour obtenir un quad core, ce qui fait qu’en cas de die problématique seul la moitié d’un quad core par à la poubelle. Chez AMD, un K10 fait 285mm² et afin entre autre d’utiliser les processeurs partiellement défectueux AMD recyclera les processeurs qui peuvent l’être en versions tri et dual core lorsque cela est possible.


Page 2 - L'architecture, la gamme, Spider

Une architecture boostée
Côté performances, l’architecture K10 améliore le K8 en divers points, en sus bien entendu du passage de 2 à 4 core. L’IPC lors de traitement SSE à notamment été boostée via l’intégration de deux unités de traitement SSE 128 bits, ce qui lui permet d’être en théorie jusqu’à deux fois plus rapide qu’un K8 et au niveau d’un Core 2. Les caches ont été adaptés à ces nouvelles capacités et leur débit a donc été doublé à fréquence identique.


L’unité de prédiction de branchement a pour sa part été améliorée afin de pouvoir traiter les branchements indirects, alors que le contrôleur mémoire DDR2 et DDR3 (sur AM2 et AM3) subit une augmentation des buffer, une amélioration du prefetech et peut travailler en mode ganged (1x128 bits) ou unganged (2x64 bits, ce qui permet par exemple de pouvoir écrire et lire en même temps).

AMD a également apporté des améliorations au niveau de la vitesse de la division entière par rapport au K8, IDIV r32 passant par exemple de 40 à 22 cycles, et les instructions de lecture mémoire sont désormais gérées en "out of order". Enfin, une unité est dédiée à la gestion des instructions de la pile.

Côté gestion de l’énergie, sur plate-forme AM2+ un Phenom voit la gestion de l’alimentation des core et du contrôleur mémoire gérée de manière distincte ce qui permet une gestion de l’énergie plus fine. De plus, la gestion de la fréquence des 4 core peut se faire de manière indépendante, alors que la tension reste pour sa part identique et équivalente à celle requise par le core le plus demandé. Nous avons pu tester avec succès cette désynchronisation des core en réglant le coefficient de ces derniers sous le logiciel AMD Overdrive.

2.3 GHz, pour commencer
Dans un premier temps, AMD lance deux Phenom, les 9600 et 9500. Respectivement cadencés à 2.3 et 2.2 GHz, ils sont annoncés à des tarifs d’environ 283 et 251$, soit environ 240 et 215 €. Comme vous pouvez le voir, AMD est agressif sur les prix puisque que Intel ne propose tout simplement pas de Quad core dans la gamme tarifaire du 9500, le Q6600 étant à environ 240 €. Bien entendu au-delà du prix il faudra voir les performances, chose que nous ferons plus loin dans cet article.


A ce sujet c’est avec un certain regret que l’on peut voir que AMD n’arrive pas à dépasser les 2.3 GHz pour le moment. Jusqu’à il y’a une semaine une version 2.4 GHz, le Phenom 9700, devait également être lancée en même temps, AMD ayant d’ailleurs organisé lors un lancement destiné à la presse européenne durant lequel il était possible de bencher ce CPU dans un environnement contrôlé (impossibilité d’installer des benchs autres que ceux présents, entre autre). Malheureusement il s’avère que cette version n’était pas vraiment stable et AMD a donc à juste titre décidé de ne pas le lancer pour le moment. Il ne va pas sans dire que cette faible montée en fréquence risque d’être problématique si elle n’est pas résolue rapidement, sachant que pour le moment AMD évoque atteindre les 2.6 GHz au premier trimestre 2008.
La plate-forme Spider
Plus qu’un processeur, AMD profite du lancement du Phenom pour lancer une plate-forme complète dénommée Spider. Elle est composée de trois éléments :

- Un processeur AMD Phenom
- Un carte mère à chipset AMD 790FX
- Un carte graphique à GPU Radeon 38x0


Si Intel a déjà tenté via le ViiV de transposer son concept de plate-forme Centrino au desktop, AMD est plus en mesure de le faire sur desktop puisque le rachat d’ATI lui permet de disposer de tous les éléments qui font l’ossature d’un PC desktop destiné au jeu. Pour le moment, Intel est en effet absent pour l’aspect GPU, alors que NVIDIA l’est du côté CPU.

Le 790FX se distingue notamment de part sa gestion PCI-Express poussée, puisqu’il permet de gérer 4 ports PCI Express x16, deux étant câblés avec 16 lignes PCI-E et deux avec 8 lignes. Le CrossFire X, qui permettra de faire fonctionner 3 voir 4 carte graphiques de concert (vous avez dit Crysis ?), nécessitera donc une carte mère de ce type, mais il n’arrivera pas avant début 2008. Le southbridge est par contre assez basique puisque le nombre de SATA est limité à 4, et que la gestion du réseau doit être confiée à des puces additionnelles.

Côté GPU, nous avons publié il y’a peu un test complet des Radeon 38x0 et nous vous invitons donc à le consulter.

Afin de bien mettre en avant le fait qu’au delà d’un processeur, c’est une plate-forme qui est lancée, nous n’avons pas obtenu pour notre test un processeur seul mais une configuration « Spider » complète qui sera vendue par le marchand LDLC  dès lundi. Bien entendu pour notre test nous n’avons conservés que le couple carte mère et processeur afin de pouvoir intégrer le tout à notre protocole de test CPU.


Page 3 - En pratique

Le Phenom 9600

Physiquement et en dehors de son marquage, rien ne distingue un Phenom d’un processeur Socket AM2 classique. Pour rappel, le Phenom et tous les processeurs AM2+ sont censés fonctionner sur les cartes mères AM2 existantes, ce qui n’est pas forcément vérifié en pratique comme indiqué plus loin. Dans ce cas, le bus HyperTransport qui fonctionne à 1.8 GHz sur AM2+ est rétrogradé à 1 GHz, et la fréquence du contrôleur mémoire est également revu à la baisse, l’AM2 ne permettant pas de gérer l’alimentation des core et de ce dernier de manière distincte.
La Gigabyte GA-MA790FX-DQ6

Les tests du Phenom ont été effectués sur une carte mère basée sur le dernier chipset AMD, à savoir le 790FX. Mise au point par Gigabyte, la GA-MA790FX-DQ6 dispose de pas moins de 4 ports PCI Express x16 et intègre en sus des fonctionnalités inhérentes au chipset deux ports Gigabit Ethernet PCI Express Realteak, un contrôleur permettant de gérer 2 SATA supplémentaires, ainsi qu’un puce FireWire.
Consommation
Nous mesurons la consommation de l’étage d’alimentation du processeur à l’aide d’une pince ampèremétrique sur les fils du connecteur ATX12V qui lui est exclusivement dédié. Ceci nous permet d’isoler d’une manière plus importante la consommation du CPU qu’une mesure de consommation générale, le seul point à noter étant que l’étage d’alimentation CPU a un rendement compris entre 80 et 90%.


Il faut noter que le Cool’n’Quiet n’as pas pu être activé sur la carte mère, que ce soit pour les A64 ou les Phenom. De même nous n’avons pas reporté les mesures de consommation du QX9650 avec 1 ou 2 Prime 95 puisque nous ne disposions plus du CPU lors du test et que ces mesures avaient été omises.


Comme vous pouvez le voir le Phenom 9600 consomme autant qu’un Athlon 64 X2 6400+, ce en pleine charge comme au repos. Par rapport à un Athlon 64 X2 4400+, la consommation est quasiment doublée. Si le QX6850, est au dessus d’un Phenom en termes de consommation, le QX9650 est grâce au 45nm en dessous, tout en étant d’un tout autre niveau de performance.
Overclocking

Même si AMD n’a pas lancé de Phenom au-delà de 2.3 GHz pour le moment, notre curiosité nous a bien entendu amenée à tester la propension à l’overclocking du Phenom 9600. Nous avons ainsi pu passer le processeur de 11.5x200 à 11.5x225 MHz soit 2,58 GHz tout en conservant une tension de 1.25V. Les 2.64 GHz ont pu être atteints via une tension de 1.3V, ces résultats étant validés par 4 sessions de Prime95 pendant 15 minutes.
(in)Compatibilité AM2 ?

Pressés par le temps, nous n’avons pu tester la compatibilité AM2 que sur une carte mère, la M2N32-SLI Deluxe d’ASUSTeK. Malheureusement, une fois le Phenom installé le système ne bootait pas, la carte mère s’éteignant au bout de quelques secondes. L’installation du dernier bios beta 1402 en date de fin octobre n’a pas changé cet état de fait. Voilà donc un point à surveiller, en espérant que des mises à jour de bios apportent cette rétrocompatibilité très attendue.
Vitesse des caches
Les tests effectués sous RightMark Memory Analyser montrent une forte amélioration de la gestion des caches sur Phenom comparés aux Athlon 64 X2 65nm. Les caches L1, L2 et L3 affichent ainsi des latences respectives de 3, 9 et 20 cycles, contre 3 et 22 cycles pour les caches L1 et L2 des Athlon 64.


La bande passante n’est pas en reste puisque le L1 va quasiment quatre fois plus vite en lecture et deux fois plus vite en écriture. Le L2 est pour sa part 2,5x plus rapide en lecture et 1,6x plus rapide en écriture.
Le test
Seul véritable problème rencontré lors de notre test : sur le Phenom, il nous a été impossible de stabiliser la plate-forme Spider avec un Command Rate du contrôleur mémoire à 1T, malgré l’emploi de divers kits mémoires de 2x1 Go. Sur le bios Gigabyte d’origine de la carte, le réglage entraîne une instabilité de la machine, alors qu’avec le dernier bios le Command Rate reste à 2T malgré ce qu’indique le bios ! Une solution peu élégante de contourner le problème ...

Voici le reste de la configuration de test :

Nous allons maintenant passer à la comparaison de ces processeurs avec d’autres processeurs dual core et quad core dans notre suite de test habituelle. Voici les configurations utilisées :

- GeForce 8800 GTX / ForceWare 169.01
- 2 x 1024 Mo DDR2-800 4-4-4
- 2 x Raptor 74 Go
- Windows XP SP2 Français
- Socket 775 : ASUSTeK P5K Deluxe
- Socket AM2 : ASUSTeK M2N32-SLI Deluxe (A64 X2 6400+)
- Socket AM2+ : Gigabyte GA-MA790FX-DQ6 (A64 X2 4400+ & Phenom)

En sus du Phenom 9600 dans sa configuration d’origine, nous l’avons également testé en activant seulement 2 puis 3 core. En configuration 2 core, ceci nous permet de mieux appréhender les améliorations de performances lié aux modifications architecturales.


Page 4 - 3ds Max 9 et Maya 8

3ds Max 9 et Maya 8
Pour ce test, nous utilisons deux scènes de tests pour Maya et 3dsmax, qui ont été mises au point par Yann Dupont de 3DVF  que nous remercions, et qui utilisent le moteur de rendu MentalRay. Ce choix n’est pas anodin puisque ce moteur est désormais disponible en standard dans ces deux logiciels et qu’il est le plus utilisé en production.

- La scène sous 3dsmax se révèle très lourde en terme de polygones et de nombre d’objets ceci afin de tester la capacité du processeur à manipuler un grand flux de données.

- Celle pour Maya est quant à elle bien plus légère mais tire profit des algorithmes d’éclairage avancés de MentalRay et sollicite le processeur sur sa puissance brute en opérations mathématiques.


Les gains entre les architectures K8 et K10 sont ici assez variables, puisqu’à nombre de core identiques ont est à 14.6% de mieux sous 3ds et 6.8% de mieux sous Maya. Cela reste insuffisant pour permettre au Phenom d’arriver au niveau d’un Core 2, puisqu’il atteint respectivement 90 et 87% des performances d’un Q6600 dans ce bench.


Page 5 - Mathematica 6 et WinRAR 3.71

Mathematica 6
Du côté des calculs scientifiques, nous utilisons la toute nouvelle version 6 de Mathematica de Wolfram Research et son benchmark intégré, à savoir le MathematicaMark2006.


Sous Mathematica l’architecture K10 apporte un gain de performance important puisque supérieur à 32%. Le fossé reste toutefois important comparé à la concurrence, le Phenom 9600 n’arrivant qu’à 71% des performances d’un Q6600.

Les tests intégrés dans MathematicaMark2006 sont les suivants : Data Fitting, Digits of Pi, Discrete Fourier Transform, Egeinvalues of a Matrix, Elementary Functions, Gamma Function, Large Integer Multiplication, Matrix Exponential, Matrix Multiplication, Matrix Transpose, Numerical Integration, Polynomial Expension, Random Number Sort, Singular Value Decomposition, Solving a Linear System.
WinRAR 3.71
Depuis la version 3.6 WinRAR est doté d'optimisations multithread. Nous compressons en RAR au niveau le plus poussé un total de 588 Mo de fichiers, répartis en 493 fichiers Word & Excel (69 Mo), 22 fichiers de boîte e-mail Eudora (251 Mo) et 1 fichier audio au format wav (268 Mo).


Avec un peu plus de 13% de gains, le K10 offre un gain non négligeable face au K8. Une fois de plus cela ne permet pas au Phenom de prendre les devants sur un Core2 Q6600. WinRAR ne profitant pas vraiment des 4 cœurs, on note que pour la première fois le Phenom se retrouve moins rapide que l’Athlon 64 X2 6400+.


Page 6 - TMPGEnc 4.0 & DiVX 6.7

TMPGEnc 4.0 XPress

La version 4 de cet encodeur MPEG-2 intègre quelques optimisations Core 2 qui permettent d’augmenter les performances d’un peu plus de 5% sur ce type de CPU. Le test reste composé de l’encodage d’un fichier DV de 10 minutes et 16 secondes au format MPEG-2, en 720x576 avec un bitrate moyen de 4500 kbits /s et en 2 passes. L’affichage de la vidéo en mode preview est activé pendant ce test et le décodage du fichier DV se fait via un codec Mainconcept, qui est plus rapide que le décodage intégré à TMPGEnc.


Les améliorations apportées aux unités SSE portent ici leurs fruits avec pas moins de 35.7% de gain entre K8 et K10 à nombre de core équivalent ! Du coup, le Phenom 9600 est cette fois relativement proche d’un Q6600, même si il se trouve légèrement en retrait.
VirtualDub & DiVX 6.7
Nous passons à la version 1.7.6 de VirtualDub, et la version 6.7 de DiVX, qui intègre des optimisations SSE4. On encode la même vidéo source que pour TMPGEnc en mode Fast recompress et via le codec DiVX 6.7 en une passe avec un bitrate moyen de 1500 kbits /s, performance d’encodage meilleure qualité et Experimental SSE4 full search activé en mode SSE4 ou SSE2. L’affichage de la vidéo en mode preview est activé pendant ce test.


En encodage DiVX Phenom 9600 et Q6600 sont encore plus proches, le quad core AMD affichant 98,2% des performances du quad core Intel. On note un gain de 26.5% entre K8 et K10.


Page 7 - Nuendo 3 & After Effects CS3

Nuendo 3

Petit nouveau dans notre suite de test, Nuendo, ici dans sa version 3, est une solution dédiée pour la production et la post-production audio. Le test consiste à exporter vers un fichier audio un projet relativement lourd (merci à DraCuLaX pour le fichier).


L’architecture K10 fait environ 10% de mieux que l’architecture K8 sur ce test, et le Phenom 9600 atteints 92,3% d’un Q6600.
Adobe After Effects CS3
Nous passons maintenant à After Effects d’Adobe dans sa version CS3. Cette fois nous appliquons divers effets et filtres sur un montage vidéo, puis compilons le film. C’est ce temps de compilation qui est pris en compte. On enregistre ici le plus faible gain du comparatif lié à l’architecture K10 : seulement 3.5% de mieux. Du coup, le Phenom est très loin des processeurs Intel, et le quad core ne profitant que peu sous ce test il se retrouve également distancé par un A64 X2 6400+.



Page 8 - Crysis, World In Conflict, Flight Sim X

Crysis, World In Conflict, Flight Sim X
Dernier FPS à la mode, Crysis dont la démo vient de sortir est ici utilisé au travers de son test processeur intégré au jeu. Sous Crysis le K10 apporte environ 15% de performances par rapport au K8 avec 2 core actifs. C’est bien mais cela suffit à peine à dépasser l’A64 X2 6400+, et les Core 2 sont eux notablement plus rapide.


World In Conflict est un jeu de stratégie temps réel récent disposant d’un bench intégré assez lourd. L’écart avec les processeurs Intel se creuse sous World In Conflict, malgré 13,3% de mieux du fait de l’architecture. Le Phenom 9600 n’atteint ici que 79% des performances d’un Q6600.


Nous terminons par Flight Simulator X, avec le framerate obtenu lors du survol d’une partie de New York après un décollage de JFK, le tout en détails « élevés ». K10 affiche un beau 19% de mieux, mais ce n’est pas suffisant pour passer devant un A64 X2 6400+ et encore moins un des Core 2.



Page 9 - Conclusion

Conclusion
Avec un gain de performance moyen de 17,4% à nombre de core équivalent, l’architecture K10 intégrée dans les Phenom offre sans conteste une efficacité nettement accrue par rapport aux Athlon 64 X2 et leur architecture K8. Malheureusement, ces gains aussi notables soient-ils ne sont pas suffisant pour permettre à AMD de reprendre le leadership en terme de performances, loin de là : un Phenom 9600 n'atteint en moyenne que 85,8% d'un Q6600.

L’architecture Intel Core s’offre ainsi le luxe d’être encore légèrement plus efficace à fréquence égale, mais aussi de monter facilement en fréquence là ou AMD bloque actuellement à 2.3 GHz avec son Phenom. Ce combo fait que Intel est sans concurrence sur le haut de gamme, et ce pour quelques temps encore. Cette avance architecturale combinée à l’avance industrielle d’Intel quand aux procédés de fabrication – les versions 45nm des processeurs Core étant à la fois moins chères à produire et moins gourmandes en énergie – fait que AMD se retrouve face à un véritable casse-tête.

Le père des Athlon a décidé d’essayer de le résoudre via deux approches distinctes : la première, c’est la mise en avant d’une plate-forme complète articulée autour du trio CPU-GPU-Chipset, qu’il est le seul à pouvoir proposer, même si pour l’instant et en attendant le CrossFire X, la plate-forme Spider n’offre pas d’avantage notable par rapport à la concurrence. La seconde, c’est le positionnement tarifaire agressif des AMD Phenom, les 9600 et 9500 étant dès leur lancement à 283 et 251$ là ou Intel ne propose pas de Quad Core à moins de 266$ : c’est bien mais sachant que le 9600 n’arrive pas au niveau du Q6600 il faudra encore un petit effort d’AMD de ce côté.

A défaut de se battre sur les performances, AMD devra donc se battre sur le rapport performance / prix malgré un coût de production a fortiori plus important : un pari risqué mais qui semble être le seul qui lui permettra d’écouler des Phenom en volume. L’autre carte dans les mains d’AMD est le tri-core, qui sera encore moins cher et qui affiche des performances intéressantes comme nous avons pu le voir dans cet article comparé à du dual core dans les applications tirant bien partie du multithread..

Bien entendu au delà du prix d’autres facteurs rentrent en compte. L’évolutivité par exemple, puisqu’on ne sait pas encore dans quelle mesure AMD va pouvoir augmenter les performances des Phenom, alors que l’on sait plus ou moins où va Intel avec ses Core2 45nm. Pour le moment AMD parle de versions 2.4 et 2.6 GHz au premier trimestre 2008. A propos d’évolutivité on regrettera pour le moment que la compatibilité AM2 ne soit pas pleinement effective, la faute on l’espère à l’absence de bios adequat pour la carte mère utilisée.

Décevant pour les amateurs de performances pures, le Phenom devra donc sont éventuel salut à un positionnement tarifaire agressif. Il faut espérer pour AMD que l’arrivée de nouveaux steppings dans les mois qui viennent et le passage en 45nm prévus pour fin 2008 permettront au K10 de réellement prendre son envol en termes de fréquence, sans quoi le Phenom se cantonnera dangereusement à ce rôle inattendu.

Mise à jour le 06/12/2007 : Nous vous conseillons purement et simplement d’éviter le Phenom dans sa révision actuelle (la B2). En effet les nouveaux bios des cartes mères intègrent un nouveau microcode pour le processeur désactivant une partie du CPU pouvant poser des soucis de stabilité, ceci au détriment des performances. Le résultat est une baisse de 11% des performances applicatives !


Copyright © 1997-2025 HardWare.fr. Tous droits réservés.