HardWare.fr


AMD A4-5000 : AMD lance Kabini, le premier Jaguar
Processeurs
Publié le Jeudi 23 Mai 2013 par Guillaume Louel

URL: /articles/895-1/amd-a4-5000-amd-lance-kabini-premier-jaguar.html


Page 1 - Introduction

Après le lancement de ses premiers SoC Jaguar destinés au marché embarqué, AMD lance aujourd'hui officiellement les premières déclinaisons qui seront disponibles pour le grand public. Il s'agit des processeurs Kabini et Temash, des processeurs basse consommation visant les marchés très cruciaux des PC portables et des tablettes.

Des processeurs qui viennent succéder aux Brazos, lancés en 2011 (voir notre test) qui visaient d'autres marchés. A l'époque pour rappel, les versions E- étaient destinées avant tout au marché desktop via des cartes mères Mini-ITX tandis que des déclinaisons C-, avec un TDP de 9W visaient le marché des Netbook. En pratique on a assez rapidement retrouvé des versions E- intégrées dans des PC portables et c'est encore le cas aujourd'hui avec la mise à jour "Brazos 2.0" et des APU comme les E2-1800. AMD annonçait d'ailleurs avoir vendu 50 millions d'unités de Brazos, en faisant le produit le plus vendu de l'histoire pour du constructeur.


Succéder à Brazos est donc particulièrement important et les Kabini sont basés sur de nouveaux cœurs côté processeurs, baptisés Jaguar. Des cœurs dont nous avons déjà beaucoup parlés puisque vous n'êtes certainement pas passés à côté des annonces respectives de Sony et de Microsoft : leurs prochaines Playstation 4 et Xbox One utiliseront 8 cœurs Jaguar dans des APU customs. Côté fabrication, notez que ces Kabini sont fabriqués en 28nm par TSMC.

Jaguar : x86 OOO basse consommation version 2

Point de vue processeur, Jaguar est avant tout une évolution de l'architecture Bobcat lancée en 2011 dans les Brazos. Bobcat s'était déjà distingué du plan des caractéristiques techniques puisqu'il s'agissait de la première architecture OOO (Out of Order, le processeur est capable de réordonnancer les instructions avant de les exécuter) x86 visant explicitement la basse consommation. L'architecture Atom d'Intel est pour rappel à l'inverse de type "In Order", en attendant le lancement de Silvermont vers la fin de l'année.

Jaguar représente donc cette seconde génération OOO pour AMD et c'est avant tout l'occasion d'effectuer des améliorations à l'existant.


Du côté du front end, AMD reprend les grandes lignes de Bobcat avec un cache d'instruction de 32 Ko et le décodage simultanée de 2 instructions. AMD indique avoir diminué la consommation du cache de 75% grâce à des optimisations et à la différence de gravure (les APU dont nous parlons sont gravés en 28nm contre 40 pour TSMC). Parmi celles-ci il y a l'ajout de quatre petit buffers de 32 octets dédié à l'exécution des boucles. Ils permettent d'économiser sur l'utilisation du cache d'instruction.

Notons deux autres changements, avec d'abord un allongement du pipeline d'une étape. Allonger le pipeline permet en général de monter en fréquence, ce qui n'a pas forcément d'importance pour les Kabini et Temash, mais qui pourrait jouer sur d'autres produits lancés ultérieurement. Cette étape de décodage supplémentaire fait partie d'améliorations diverses qui ont pour but d'améliorer le fonctionnement des prefetchers.


Du côté des unités d'exécution, notons d'abord l'arrivée de nouvelles instructions avec le support de SSE 4.1/4.2, d'AVX et aussi des instructions AES et F16C. AMD a également ajouté de nouvelles macro opérations pour traiter de manière plus efficace certaines instructions existantes. Côté entier, on retrouve toujours deux unités avec deux changements notables, d'abord une augmentation de la taille des ROB pour tenter de trouver autant que possible du parallélisme. L'autre changement est du côté des unités de divisions qui est héritée de Llano qui double les performances par rapport à l'unité précédente.


C'est côté flottant que l'on retrouve le plus de changement. L'arrivée d'AVX entraine un passage à des unités 128 bits natives, l'exécution des instructions 256 bits se faisant par deux passages simultanés dans le pipeline. Notez également qu'AMD a ajouté une seconde étape dans le pipeline à cet endroit, portant le nombre total de 15 pour Bobcat à 17 pour Jaguar.


Notez que l'on retrouve enfin des améliorations du côté des caches de données. Le L1D garde une taille de 32 Ko mais les unités load/store OOO ont été complètement redessinées, profitant grandement de l'expérience obtenue avec Bulldozer.


Du côté des caches de niveau 2, beaucoup de choses changent par rapport à Bobcat ou chaque cœur disposait de son propre cache de 512 Ko. Les cores Jaguar s'interconnectent maintenant au reste de la puce par une interface L2. Dans le cas de Kabini, quatre cœurs Jaguar viennent s'interfacer vers ce bloc qui fonctionne à la même fréquence que les cores. Disposer d'un cache partagé permet en prime de faciliter la communication entre les cœurs. Pour le cache a proprement parler, il s'agit d'un cache inclusif (le L1 est recopié dans le L2) partitionné en quatre banks avec une associativité 16 way.


Page 2 - Radeon HD 8000, mais surtout un SoC !



Radeon HD 8000 : GCN

Côté graphique, Kabini est la première APU à profiter de l'architecture GCN d'AMD. Pour rappel, nous avions détaillées en long et en large cette architecture dans cet article.


Pour rappel du côté des grandes lignes, il s'agit bien sur d'une architecture compatible DirectX 11.1 côté graphique, et côté compute OpenCL 1.2. Il s'agit bien entendu d'une adaptation basse consommation de GCN et l'on retrouvera quelques changements à cet effet.


Côté géométrie, les primitives sont traitées en quatre cycles tandis que la partie calcul proprement dite est gérée par deux CU (Compute Unit) qui disposent d'un cache commun de niveau 2 de 128 Ko. Le global data share, petit cache supplémentaire qui permet de faciliter les échanges entre les CU sans devoir passer par le L2 voit sa taille réduite en conséquence à 4 Ko.


Côté compute, on retrouvera par contre quatre unités ACE (Asynchronous Compute Engines), des processeurs de commande dédiés spécifiquement aux traitements compute. Pour rappel on n'en trouve que deux par exemple sur une HD 7970. Notez enfin que les CU supportent désormais un modèle d'adressage mémoire à plat, sans pagination. Des évolutions qui ne sont pas sans rappeler celles appliquées aux GPU Bonaire, nous vous renvoyons vers cet article pour plus de détails.

Kabini : un SoC x86

Au-delà de l'addition CPU + GPU qu'AMD vend sous le nom d'APU, Kabini rajoute également le chipset ce qui en fait de facto un SoC, quelque chose de jusqu'ici peu commun côté x86 côté PC portables.


Revenons cependant un instant sur le contrôleur mémoire intégré sous la forme d'un northbridge. Il s'interconnecte à la mémoire en simple canal, le contrôleur supportant des tensions de 1.25, 1.35 et 1.5V en DDR3-1600. Le northbridge gère également quatre lignes PCI Express pour des périphériques additionnels et un lien 4x pour un GPU additionnel au format MXM, mais l'on notera surtout les interconnexions. En effet, le GPU et l'interface L2 sont reliées d'une part à ce northbridge, tout comme le bloc Radeon. Les deux pouvant ainsi s'échanger des informations via un crossbar sans passer par la mémoire centrale. De manière encore plus intéressante, on notera la présence d'un lien direct entre le GPU et le contrôleur mémoire.


En effet afin d'éviter la latence induite par le northbridge, le GPU peut directement envoyer des commandes au contrôleur mémoire qui les traitera en priorité. Le GPU peut cependant aussi passer par le northbridge pour accéder à l'espace mémoire unifié du processeur. Cet accès cohérent à la mémoire a cependant un cout sur les performances et est réservé aux usages compute. Le choix de ce datapath dédié au graphisme semble donc, sur le papier, un choix assez intelligent de la part d'AMD.


Vous pouvez retrouver sur ce schéma au milieu l'APU Kabini, en vert les blocs CPU/Jaguar et en rouge le GPU. S'y ajoutent un contrôleur écran supportant eDP, DP, HDMI et VGA. Pour le reste, c'est le southbridge, ou Fusion Hub en parlance AMD qui gère deux ports serial ATA 6Gb/s, deux ports USB 3.0 et jusque 8 ports USB 2.0.


Page 3 - Les gammes Kabini et Temash

AMD lance en parallèle plusieurs processeurs basés sur ces SoC. On retrouve d'abord Kabini, puce dédiée au marché des PC portables d'entrée de gamme et que l'on retrouvera en version quadruple et double cœur avec une large gamme de TDP allant de 9 à 25 watts.


Les modèles double cœurs seront baptisés E1 et E2, ils ne sont équipés que d'un Mo de cache L2 mais conservent un GPU commun avec 128 unités shaders. Les fréquences CPU et GPU font la segmentation, tout comme l'absence de support de la DDR3L-1600 sur les E1.

Pour les APU quad core, deux modèles sont lancés, l'A4-5000 et l'A6-5200. La encore le GPU reste commun avec ses 128 unités shaders et la segmentation se fait sur la fréquence, et sur le TDP. L'A6-5200 atteint un TDP un peu plus important de 25 watts en effet qui le destine à des machines un peu plus volumineuses.

En parallèle, AMD proposera ces mêmes SoC pour le marché des tablettes. On retrouve trois modèles, le plus petit offrant un TDP de 3.9 watts, ce qui donne aux SoCs Kabini/Temash une gamme de TDP assez large.


Un modèle quadruple cœur est aussi proposé avec un TDP de 8 watts, on notera d'ailleurs une fréquence Turbo, possiblement atteignable uniquement sur un cœur actif, cela n'est pas précisé par AMD.

Notez au passage que les APU pour PC portable ne sont pas équipés de Turbo et fonctionnent à la fréquence maximale sur un ou quatre cœurs. Au repos, les cœurs repassent à une fréquence de 800 MHz pour économiser de l'énergie.

Et de nouveaux Richland ?

Au milieu de sa présentation, et alors que nous n'avons pas encore vu les premiers modèles de Richland annoncés en mars, AMD a annoncé une nouvelle fournée d'APU Richland !


Les trois premiers modèles reprennent les caractéristiques des A10-5750M, A8-5550M et A6-5350M et augmentent simplement, dans le cas des deux premiers, la fréquence de base du GPU (passant de 533 à 600 MHz et de 515 à 554 MHz). Pour le troisième, les caractéristiques sont cependant identiques et l'on ne comprend pas trop la différence ou l'intérêt de lancer ces "nouveaux" modèles !

La seconde fournée est plus intéressante puisqu'il s'agit de modèles dont le TDP est un peu plus faible, entre 17 et 25 watts, des modèles qui viennent faire écho aux versions Trinity qui avaient été lancées l'année dernière. 


Page 4 - Configurations de test

Afin de pouvoir tester Kabini, AMD nous a fourni une machine portable de test. Il s'agit d'un PC portable assez original. L'utilisation d'un SoC 15 watts permet d'abord de réaliser, si ce n'est des "ultrabook", des PC un peu plus fin. Il s'agit ici d'un 14 pouces de 2.2cm d'épaisseur pour un poids de 1.6 Kg. Un portable original qui mixe des composants de qualité diverse !


Le châssis en plastique n'est en effet pas de très grande qualité, plus proche de ce que l'on trouve en entrée de gamme. A l'inverse la machine est équipée d'une dalle AU Optronics 1080p connectée en eDP dont la qualité est réellement excellente. Un choix un peu haut de gamme expliqué par AMD par la volonté de pousser les OEMs à aller vers des écrans de qualité en haute résolution. On peut émettre un doute sur le fait qu'ils suivent.


Autre particularité de ce système : son stockage. AMD a en effet opté pour un disque dur hybride de Toshiba, un MQ01ABD100H  de 1 To utilisant deux plateaux en 5400 rpm, accompagnés de 8 Go de mémoire flash NAND. Installé dans la machine, ce disque ne nous a pas vraiment impressionnés, rendant l'utilisation du PC assez poussive, même dans des tâches simples comme la navigation web.

Afin de réaliser nos tests, nous avons remplacé ce disque par un SSD Samsung 830 qui a levé les lourdeurs que l'on avait noté avec le disque hybride. Si la machine n'est pas une foudre de guerre dès que l'on attaque des calculs intensifs, elle est parfaitement utilisable pour un usage basique.

Et en face ?

Si AMD nous a fourni une machine équipée de l'APU A4-5000, c'est avant tout parce qu'elle vient attaquer un segment ou il y a assez peu de compétition. Outre le fait qu'il s'agisse d'un SoC, il s'agit d'une plateforme basse consommation, 15 watts, segment sur lequel il n'y a pas forcément de compétition dans la tranche de prix visée par AMD. Car en effet AMD estime que les machines équipées d'un SoC A4-5000 seront disponible dans une tranche tarifaire allant de 399 à 499 euros, un bon cran en dessous des ultrabooks (qui sont ce que l'on trouve chez Intel de plus proche côté consommation en PC portable).

A prix équivalent en machines, on trouvera surtout chez Intel des processeurs comme ce Celeron 1000M , un processeur double cœur Ivy Bridge à 1.8 GHz au TDP de 35 watts. Une comparaison qui n'est pas parfaite sur le plan des caractéristiques, mais qui s'approche le plus des choix qui seront présentés en magasin dans les semaines à venir.


Le Celeron 1000M d'Intel

Nous allons donc utiliser ce processeur comme comparaison sur le plan des performances, nous comparerons également à une plateforme Brazos E-350 en mini-ITX afin de voir l'évolution de performances par rapport à la génération précédente chez AMD. L'E-350 était pour rappel un APU 15 watts, double cœur cadencé à 1.6 GHz. Il nécessitait en prime un southbridge sur sa plateforme.

Notez enfin que toutes les machines sont configurées en single channel avec une barrette mémoire de 4 Go de DDR3 1600CL11. Sur la plateforme Brazos, le support mémoire est limité au 1333 (CL9).


Page 5 - Performances mémoire

Nous avons commencé par regarder les performances mémoires des différentes plateformes. Elles utilisent pour l'A4-5000 et le Celeron 1000M une barrette mémoire 1600 (CL11). Côté Brazos (E-350) la plateforme est limitée à la DDR3 1333 (CL9).

Bande passante mémoire monothread

Nous utilisons Aida64  pour mesurer la bande passante mémoire single thread :


Sans trop de surprise Kabini fait significativement mieux que Brazos dans ce test en lecture, mais les performances en écriture restent basse, et sont même en léger retrait. Le contrôleur mémoire du Celeron 1000M joue dans une autre catégorie.

Bande passante mémoire multithread

Nous utilisons RMMT, outil présent dans la suite RMMA de Rightmark pour mesurer la bande passante multithread.


Les performances multithread font relativement écho à celles des performances monothread pour Kabini.


Page 6 - Performances CPU : Cinebench, Fritz, 7-Zip

Afin d'évaluer les performances processeur, nous avons observé les performances dans trois benchs qui proposent à la fois un mode monothread et multithread, ce qui permet d'observer plus précisément le comportement très différent de Kabini en fonction de ce critère que d'autres tests X ou Y qui seraient dans l'un ou l'autre des cas.

Cinebench R11.5


Ce benchmark est base pour rappel sur le moteur du logiciel de rendu Cinema 4D de Maxon.


Notons tout d'abord un gain en monothread entre Brazos et Kabini a fréquence presque égale (le E-350 Brazos est cadencé à 1.6 GHz contre 1.5 pour l'A4-5000 Kabini), Kabini fait mieux de presque 22%. Un gain qui monte, avec quatre threads, à 2.4x.

L'écart de performance monothread est cependant significatif avec le Celeron 1000M, même si au final les performances multithread se tiennent, ce qui reste une bonne performance pour le Kabini cadencé pour rappel 300 MHz moins rapidement que le Celeron.

Fritz Chess Benchmark 4.3


Nous passons maintenant à Fritz Chess Benchmarking, de l'éditeur Chess Base. Les chiffres sont exprimés en Kilonoeuds par secondes.


Sous ce benchmark les modifications effectuées sur les cœurs Jaguar ne parlent pas et Kabini est un peu plus lent en mode monothread (2%), le léger gain d'IPC ne compensant pas l'écart de fréquence. En multithread le doublement des cœurs permet de doubler les performances, et l'A4-5000 passe même devant le Celeron 1000M.

7-Zip 9.20


Nous compressons une série de fichiers de tailles et compressibilités diverses en utilisant le mode multithreadé LZMA2 de l'outil de compression open source 7-Zip.


L'A4-5000 fait plus que doubler les performances sous 7-Zip par rapport à l'E-350 en mode multithread. On notera surtout que le passage de 1 à 4 thread divise par trois le temps de compression, un scaling assez bon, meilleur que côté E-350 mais qui reste assez loin de celui proposé par le Celeron. Ce dernier reste au final un peu plus rapide dans ce test.


Page 7 - Performances GPU : F1 2011, Batman Arkham City, Battlefield

Nous avons également regardé les performances graphiques via trois jeux. Tous les jeux sont testés en 1366x768. Notez que nous avons testé le Celeron en mode simple canal, bien que la plateforme utilisée supporte le double canal. En pratique, la majorité des machines du commerce sont configurées ainsi, à notre grand regret. Vous pouvez voir l'impact d'un canal supplémentaire par exemple dans cet article.

F1 2011


Nous utilisons le mode graphique intermédiaire DX9 dans ce jeu :


Sous F1 2011 le niveau de performance reste très modeste et le jeu ne peut pas être considéré comme jouable malgré une résolution faible. C'est aussi là une des inadéquations entre les ambitions d'AMD de pousser les OEM vers des écrans 1920 par 1080 sur ces machines. En pratique, quelque soit la taille de l'écran, on ne jouera pas à ce genre de titres. A titre de comparaison, notez que nous obtenions dans les mêmes conditions 32 FPS avec une APU Trinity.

Batman Arkham City


Nous utilisons le mode graphique minimal DX9 dans ce jeu :


Un petit avantage une fois de plus à l'A4-5000 même si l'on reste sous les 30 images par secondes en moyenne. Le niveau de performances proposé pour 15 watts est très bon, le problème reste l'inadéquation des jeux à ce niveau de performances, certes plus élevé que sur Brazos et les plateformes équivalentes précédentes, mais toujours trop bas. Pour rappel, Trinity en simple canal obtenait 26 FPS dans ce test.

Battlefield 3


Nous utilisons le mode graphique minimal dans ce jeu :


Battlefield 3 est tout simplement injouable avec toutes les configs, ce n'est pas une surprise, Trinity bien que plus performant n'était déjà pas jouable !


Page 8 - Conclusion

Avec Kabini, AMD lance une nouvelle gamme d'APU - en 28 nm - dont le positionnement est assez original. Dérivées des Brazos qui ont trouvé ces deux dernières années leur place dans les PC portables d'entrée de gamme, les APU Kabini continuent sur cette nouvelle lancée avec une vision très claire sur le type de machines attendues. Il s'agit avant tout d'aller se trouver une place dans l'un des rares segments ou Intel n'a pas vraiment de produit équivalents.

Car d'équivalence exacte il n'y en a pas si l'on regarde sur le plan technique. L'intégration du chipset dans Kabini en fait l'un des premiers SoCs x86 grand public (hors marchés spécifiques), et qui plus est quadruple cœurs. Le tout dans une enveloppe de 15 watts, ce qui en soit reste une assez belle prouesse. L'arrivée d'une architecture mémoire unifiée pour le compute, et la présence d'un lien dédié entre le GPU et le contrôleur mémoire pour bypasser les mécanismes de cohérence de cache sont également une première pour le constructeur.


Bien sur les performances restent d'entrée de gamme, suffisantes pour une utilisation web/bureautique/multimédia basique et pas au-delà, mais il s'agit bien là des ambitions d'AMD avec cette déclinaison de Kabini. Côté CPU et GPU, la plateforme fait quasi jeu égal avec une plateforme Celeron 1000M pour peu que l'on se retrouve dans des scénarios multithreads. En jeu, si le niveau de performances est un peu plus élevé, il reste bien trop bas en pratique pour pouvoir jouer dans des conditions acceptables, malgré une résolution réduite. Un vrai problème qui fait que l'on ne s'extasiera pas sur l'écart creusé par rapport à Brazos, même s'il est important.

Chez Intel, cette enveloppe thermique se retrouve à cheval entre les déclinaisons d'Atom, vieillissantes, certes peu chères mais très peu performantes, et les déclinaisons d'Ivy Bridge basse consommation, largement plus performant, mais destinées à des machines plus chères. Intel aura cependant un produit équivalent à proposer d'ici la fin de l'année, les futurs Atom Bay Trail basés sur l'architecture Silvermont.


En attendant, AMD propose au travers de son A4-5000 une proposition unique et originale : des machines d'entrée de gamme aux performances certes modestes, mais à l'autonomie très élevée. Une proposition qui peut faire sens sur le marché actuel ou le prix est plus que jamais un argument déterminant pour l'achat d'un PC portable.

Une proposition qu'AMD, et c'est là tout le problème, n'effectue pas directement : ce sont les partenaires OEM d'AMD qui décideront des machines qu'ils mettront en place, et si AMD nous a martelé vouloir pousser vers la qualité, notamment du côté des écrans, on ne peut pas prédire si ces derniers suivront les préconisations de la marque. En l'état cependant, Kabini peut permettre la création de produits intéressants et originaux, par exemple PC/tablettes hybrides, pour un tarif serré. Il faudra voir dans les semaines, et plus probablement les mois à venir ce que les OEM en feront.

Terminons enfin d'un mot sur l'architecture Jaguar qui effectue ici son premier tour de piste. Si ses performances monothread à 1.5 GHz restent assez faibles, le niveau de performances multithread obtenu sur 15 watts dans Kabini est excellent. Il restera à voir comment se comporteront ces cœurs dans d'autres conditions, par exemple lorsque l'on doublera leur nombre, un point qui pourrait être assez important dans les futures déclinaisons que l'on retrouvera sur les Playstation 4 et autres Xbox One !


Copyright © 1997-2024 HardWare.fr. Tous droits réservés.