AMD A4-5000 : AMD lance Kabini, le premier Jaguar

Tags : AMD; Brazos; Celeron; Intel; Kabini;
Publié le 23/05/2013 par
Imprimer
Après le lancement de ses premiers SoC Jaguar destinés au marché embarqué, AMD lance aujourd'hui officiellement les premières déclinaisons qui seront disponibles pour le grand public. Il s'agit des processeurs Kabini et Temash, des processeurs basse consommation visant les marchés très cruciaux des PC portables et des tablettes.

Des processeurs qui viennent succéder aux Brazos, lancés en 2011 (voir notre test) qui visaient d'autres marchés. A l'époque pour rappel, les versions E- étaient destinées avant tout au marché desktop via des cartes mères Mini-ITX tandis que des déclinaisons C-, avec un TDP de 9W visaient le marché des Netbook. En pratique on a assez rapidement retrouvé des versions E- intégrées dans des PC portables et c'est encore le cas aujourd'hui avec la mise à jour "Brazos 2.0" et des APU comme les E2-1800. AMD annonçait d'ailleurs avoir vendu 50 millions d'unités de Brazos, en faisant le produit le plus vendu de l'histoire pour du constructeur.


Succéder à Brazos est donc particulièrement important et les Kabini sont basés sur de nouveaux cœurs côté processeurs, baptisés Jaguar. Des cœurs dont nous avons déjà beaucoup parlés puisque vous n'êtes certainement pas passés à côté des annonces respectives de Sony et de Microsoft : leurs prochaines Playstation 4 et Xbox One utiliseront 8 cœurs Jaguar dans des APU customs. Côté fabrication, notez que ces Kabini sont fabriqués en 28nm par TSMC.

Jaguar : x86 OOO basse consommation version 2

Point de vue processeur, Jaguar est avant tout une évolution de l'architecture Bobcat lancée en 2011 dans les Brazos. Bobcat s'était déjà distingué du plan des caractéristiques techniques puisqu'il s'agissait de la première architecture OOO (Out of Order, le processeur est capable de réordonnancer les instructions avant de les exécuter) x86 visant explicitement la basse consommation. L'architecture Atom d'Intel est pour rappel à l'inverse de type "In Order", en attendant le lancement de Silvermont vers la fin de l'année.

Jaguar représente donc cette seconde génération OOO pour AMD et c'est avant tout l'occasion d'effectuer des améliorations à l'existant.


Du côté du front end, AMD reprend les grandes lignes de Bobcat avec un cache d'instruction de 32 Ko et le décodage simultanée de 2 instructions. AMD indique avoir diminué la consommation du cache de 75% grâce à des optimisations et à la différence de gravure (les APU dont nous parlons sont gravés en 28nm contre 40 pour TSMC). Parmi celles-ci il y a l'ajout de quatre petit buffers de 32 octets dédié à l'exécution des boucles. Ils permettent d'économiser sur l'utilisation du cache d'instruction.

Notons deux autres changements, avec d'abord un allongement du pipeline d'une étape. Allonger le pipeline permet en général de monter en fréquence, ce qui n'a pas forcément d'importance pour les Kabini et Temash, mais qui pourrait jouer sur d'autres produits lancés ultérieurement. Cette étape de décodage supplémentaire fait partie d'améliorations diverses qui ont pour but d'améliorer le fonctionnement des prefetchers.


Du côté des unités d'exécution, notons d'abord l'arrivée de nouvelles instructions avec le support de SSE 4.1/4.2, d'AVX et aussi des instructions AES et F16C. AMD a également ajouté de nouvelles macro opérations pour traiter de manière plus efficace certaines instructions existantes. Côté entier, on retrouve toujours deux unités avec deux changements notables, d'abord une augmentation de la taille des ROB pour tenter de trouver autant que possible du parallélisme. L'autre changement est du côté des unités de divisions qui est héritée de Llano qui double les performances par rapport à l'unité précédente.


C'est côté flottant que l'on retrouve le plus de changement. L'arrivée d'AVX entraine un passage à des unités 128 bits natives, l'exécution des instructions 256 bits se faisant par deux passages simultanés dans le pipeline. Notez également qu'AMD a ajouté une seconde étape dans le pipeline à cet endroit, portant le nombre total de 15 pour Bobcat à 17 pour Jaguar.


Notez que l'on retrouve enfin des améliorations du côté des caches de données. Le L1D garde une taille de 32 Ko mais les unités load/store OOO ont été complètement redessinées, profitant grandement de l'expérience obtenue avec Bulldozer.


Du côté des caches de niveau 2, beaucoup de choses changent par rapport à Bobcat ou chaque cœur disposait de son propre cache de 512 Ko. Les cores Jaguar s'interconnectent maintenant au reste de la puce par une interface L2. Dans le cas de Kabini, quatre cœurs Jaguar viennent s'interfacer vers ce bloc qui fonctionne à la même fréquence que les cores. Disposer d'un cache partagé permet en prime de faciliter la communication entre les cœurs. Pour le cache a proprement parler, il s'agit d'un cache inclusif (le L1 est recopié dans le L2) partitionné en quatre banks avec une associativité 16 way.
Vos réactions

Top articles