CPU mobiles : AMD A8 et A10 contre Core i5 et i7 (Llano, Trinity, Sandy et Ivy Bridge)

Publié le 11/06/2012 par
Imprimer
Il y a un an de cela, AMD avait lancé ses premières APU mobiles destinées aux PC portables. Baptisées Llano, ces puces étaient la concrétisation de la stratégie du rachat du constructeur graphique ATI puisqu'elles intégraient à la fois une partie processeur x86 ainsi qu'un GPU. Une "vision" plusieurs fois repoussée et réalisée par Intel début 2011 avec Sandy Bridge.

Côté technique Llano repose sur l'intégration de cœurs x86 issus de l'architecture K10.5, à savoir celle qui animait les Athlon II du constructeur. Gravés en 32nm (contre 45 pour les Athlon II), ces puces se distinguent cependant par la taille du cache de niveau 2 qui passait de 512 Ko par cœur à 1 Mo par cœur. Les Llano sont dépourvus de cache de niveau 3.


Côté GPU, Llano reposait sur l'intégration d'un Redwood, le GPU qui animait les Radeon HD 5570. Il utilisait pour rappel l'architecture VLIW5 d'AMD. Notez enfin que si le CPU disposait bien d'un mode Turbo, ce n'était pas le cas du GPU.

Trinity, page blanche ?

Mi mai, AMD a lancé officiellement sa seconde version de son APU pour PC portables, baptisée Trinity. Et il est difficile de ne pas penser que le constructeur est reparti d'une page blanche tant Llano et Trinity diffèrent.

Commençons tout de même sur ce qu'ils ont en commun, Llano et Trinity sont tout deux des APU gravés en 32nm SOI par GlobalFoundries. Dernier point commun, les deux puces sont dépourvues de cache de niveau 3.

Côté CPU, exit les cœurs x86 K10.5 qui laissent leur place à des modules "Piledriver". Il s'agit pour rappel de la version 2 de l'architecture Bulldozer, lancée côté desktop avec les AMD FX l'année dernière. Le concept de base de Bulldozer et de Trinity repose sur la fusion de deux cœurs en un module qui partagent un certain nombre de ressources. Ainsi, le module dispose de deux unités de calcul pour les nombres entier, et d'une unité partagée qui sera utilisée pour les calculs en virgule flottante. Et si chaque cœur dispose d'un cache de niveau 1, ils se partageront un cache de niveau 2, ainsi que d'autres ressources (décodeurs d'instructions, prefetcher, etc…)


AMD annonce de très nombreux changements dans son architecture Piledriver par rapport à Bulldozer, ou plus exactement des petites corrections un peu partout. Les détails fournis par AMD restent cependant relativement de haut niveau. D'abord côté jeu d'instruction on notera que Piledriver gère les FMA3 (Fused Multiply/Add sur 3 opérandes, a = a * b +c ) en plus du FMA4 (a = b * c + d) déjà géré précédemment (Intel utilisera le FMA3 à compter de l'année prochaine), ainsi que les instructions de conversion flottantes 16/32 bits F16C introduites par Intel dans Ivy Bridge.

Pour le reste les modifications se font par petites touches à tous les niveaux, les mécanismes de prédictions de branchement sont annoncés comme plus efficaces tout comme les schedulers tandis que des gains sont annoncés sur les divisions. Il est globalement assez difficile de juger l'impact qu'auront ces changements sur les performances et l'absence de cache de niveau 3 nous empêche de réaliser une comparaison à fréquence égale avec les AMD FX "Bulldozer" (il faudra attendre les AMD FX "Piledriver" Desktop, les Vishera prévus pour le troisième trimestre). AMD annonçait pour rappel un gain entre Bulldozer et Piledriver inférieur à 10%. Globalement c'est surtout du côté de la consommation et de l'efficacité énergétique qu'AMD estime avoir fait le plus de gains avec de 10 à 20% d'économie d'énergie par rapport à l'architecture Bulldozer.


En ce qui concerne le GPU, là aussi tout est nouveau puisque l'on passe d'une architecture VLIW5 à l'architecture VLIW4 utilisée sur les GPU Cayman (Radeon HD 6900) d'AMD l'année dernière. Le nombre d'unités de calcul dépend des modèles, ainsi l'A10 que nous avons testé aujourd'hui dispose de 384 unités shaders, les A8, A6 et A4 disposeront respectivement de 256, 192 et 128 unités.


Dernière modification notable, celle du Turbo. AMD dispose désormais à la fois d'un Turbo CPU et GPU, les deux pouvant être utilisés en fonction des besoins.


En pratique toutes ces modifications ont permis à AMD de proposer une baisse du TDP sensible par rapport à Llano. Ainsi, exit les modèles haut de gamme 45 watts, AMD vise désormais des TDP de 17, 25 et 35 watts. Le meilleur des APU Trinity, celle que nous testons aujourd'hui est l'A10-4600M. Son équivalent le plus proche, le meilleur des Llano en 35 watts lancé en décembre dernier est l'A8-3520Mque nous avons également testé.

AMD aura rajouté entre les deux puces environ 125 millions de transistors, mais dans les deux cas il s'agira de puces quadruples cœurs. Côté fréquences cependant Trinity propose un bon en avant significatif de 700 MHz que ce soit en fréquence de base ou en mode Turbo. La fréquence de l'IGP augmente peu, passant de 444 à 468 MHz mais son mode Turbo lui permettra d'atteindre 686 MHz. De quoi permettre à Trinity d'être 20% plus performant côté CPU, et 30% plus performant côté GPU par rapport à Llano comme annoncé par AMD ? Quelque chose que nous allons rapidement vérifier !
Vos réactions

Top articles