Les contenus liés aux tags ARM et Qualcomm

Afficher sous forme de : Titre | Flux

CES: Snapdragon 600, 800: Qualcomm accélère

Publié le 16/01/2013 à 11:25 par Damien Triolet

En l'espace de quelques années, Qualcomm s'est imposé comme un des leaders, sinon le leader, dans la conception de processeurs, ou SoC (System-on-Chip), dédiés à la mobilité. Commercialisés sous la marque Snapdragon, ceux-ci se retrouvent dans de nombreux smartphones ou tablettes et, en 2013, Qualcomm entend bien profiter de sa position de force actuelle pour accélérer la cadence de leur développement.

Si Qualcomm n'a pas encore l'expérience d'un Microsoft lorsqu'il s'agit d'organiser une conférence d'envergure, ce n'est pas un hasard si c'est le spécialiste du SoC qui a eu l'honneur de remplacer la firme de Redmond pour la keynote d'ouverture du CES. Tenue par Bill Gates et Steve Ballmer durant 12 années consécutives, cette keynote représente une tribune importante, qui se doit de suivre l'évolution de l'électronique.


Le Dr Paul Jacobs, CEO de Qualcomm, à droite, qui remplaçait Steve Ballmer, CEO de Microsoft, à gauche, pour la keynote d'ouverture du CES 2013 n'a pas manqué d'inviter ce dernier en guise de clin d'œil.

Qualcomm n'était pas venu les mains vides et a profité de cette keynote pour annoncer une nouvelle gamme de SoC : les Snapdragon 200, 400, 600 et 800. Par rapport à la gamme S4 actuelle, il s'agit d'une nouvelle nomenclature qui donnera probablement plus de flexibilité pour dénommer les dérivés que les qualificatifs Play, Plus, Pro et Prime. Si les spécificités des Snapdragon 200 et 400 n'ont pas été dévoilées, quelques détails, certes minces, sur les modèles haut de gamme ont été présentés.



Les Snapdragon 600 et 800
Le Snapdragon 600 reposera sur une évolution des cores ARM maisons, qui passeront en version Krait 300, et sur un GPU Adreno 320, déjà aperçu sur les S4 Pro. Tout comme ces derniers, le Snapdragon 600 est fabriqué sur le process 28nm LP, une similitude qui n'empêche pas Qualcomm de parler d'un gain qui pourra atteindre 40% au niveau de la puissance CPU entre le quadcore S4 Pro APQ8064 et le quadcore 600 APQ8064T.

Cette augmentation des performances provient d'une part d'une fréquence en hausse (1.9 GHz max contre 1.7 GHz max) et d'autre part de petites évolutions de l'architecture Krait avec l'ajout d'un prefetcher et une optimisation du frontend : prédiction de branchement améliorée et meilleure exploitation du moteur d'exécution OOO (Out of Order). Pour rappel, Krait est une implémentation personnalisée de l'architecture ARMv7 qui se situe quelque parte entre un Cortex A9 et un Cortex A15.

Pour le reste, le Snapdragon 600 semble reprendre les spécificités des S4 Pro : contrôleur mémoire double canal à 533 MHz, moteur vidéo 1080p 30fps, processeur d'image 20 megapixels avec support de 3 caméras, sortie video HDMI 1.4 et USB 2.0.


Le Snapdragon 800, ou MSM8974, sera de son côté fabriqué sur le process 28nm HPm de TSMC, qui offre une marge de manœuvre plus importante pour combiner hautes fréquences et faible consommation. Les 4 cores Krait passeront en version 400, similaires à la versions 300 mais notamment une interface mémoire revue pour monter en fréquence avec le support de la LPDDR3-800, toujours en double canal. Grâce au process 28nm HPm, ils pourront atteindre jusqu'à 2.3 GHz.

Qualcomm en a profité pour doubler la puissance de calcul du GPU Adreno qui passe en version 330, sans que nous ne sachions si cela est lié à une augmentation de sa fréquence, à l'intégration de plus d'unités de calcul ou à un mélange des 2. Etant donné que Qualcomm précise que le doublement concerne la puissance de calcul, et non les performances graphiques qui ne progresseraient "que" de 50%, nous pouvons supposer qu'il s'agit principalement de l'ajout d'unités de calcul. Qualcomm ne s'est pas arrêté là et a intégré le support du format UHD (4K) ainsi qu'un double processeur d'image qui peut monter jusqu'à 55 megapixels et piloter 4 caméras.

Ces 2 futurs SoC intègrent par ailleurs un modem LTE cat.4 et un contrôleur wifi 802.11ac. De quoi pouvoir prendre en charge tous les moyens de communications modernes sans avoir besoin de contrôleurs externes. Interrogé par rapport au modem externe programmable de Nvidia, l'i500, Qualcomm réplique que si l'approche est intéressante, elle permet difficilement à l'heure actuelle de s'approcher de l'efficacité énergétique des solutions fixes classiques.

Il est intéressant d'observer que Qualcomm ne fait pas appel au "silicium noir", soit à l'utilisation de différents types de cœurs CPU adaptés à différentes tâches, pour augmenter l'efficacité énergétique. Pour rappel, Nvidia avec le Tegra 3/4 utilise un core compagnon optimisé basse consommation qui prend le relai des 4 cores classiques pour traiter les tâches simples. De son côté, Samsung avec l'Exynos 5 Octa a opté pour l'approche big.LITTLE d'ARM qui consiste à associer deux groupes de 4 cores différents : l'un optimisé pour les hautes performances (Cortex A15) l'autre optimisé pour une faible consommation (Cortex A7). Qualcomm estime que ses propres cores Krait sont suffisamment efficaces pour rester compétitifs à l'heure actuelle sans avoir recours à une telle approche.


Les GPU Adreno 320 et 330
Qualcomm développe ses propres solutions graphiques et se base pour cela sur l'expérience de la division Imageon rachetée (sans la marque) à AMD/ATI il y a quelques années. Ce n'est ainsi pas un hasard si ses GPU Adreno (anagramme de Radeon) sont plutôt efficaces. Ceux-ci fonctionnent avec un mode de rendu basé sur des tiles, des petites zones de l'écran qui peuvent tenir en cache et éviter de dépenser trop de bande passante mémoire, un bien précieux sur les SoC. Il ne s'agit cependant pas d'un rendu différé et cette approche est plutôt à mettre en parallèle avec celle du GPU Xenos de la Xbox 360 (qui peut utiliser des tiles, plus grosses, qui tiennent dans sa mémoire eDRAM) qu'avec celle des GPU PowerVR.

Les Adreno 320/330 peuvent également fonctionner dans un mode de rendu purement direct, comme le font les GPU GeForce et Radeon, si le développeur l'estime plus efficace. Ils reposent sur une architecture unifiée avec à sa base des unités de calcul FP32 qui disposent cependant de modes rapides en FP16 et en FX10. Ils supportent ainsi OpenGL ES 3.0, DirectX 11.1 level 9_3 et OpenCL. Un gros avantage face aux GPU GeForce ULP de Nvidia qui selon toute vraisemblance restent limités à OpenGL ES 2.0 et DirectX 11.1 level 9_1, sans aucun support du GPU computing, même dans leur future version Tegra 4.


Sur son stand du CES, Qualcomm mettait d'ailleurs en avant les capacités vidéo ludiques du Snapdragon 800 et un employé de sa division graphique nous a indiqué que les investissements étaient importants au niveau du développement des pilotes et des relations développeurs. Deux points essentiels pour que les GPU Adreno soient exploités au mieux puisqu'il ne suffit pas de disposer d'une architecture avancée et d'une puissance de calcul importante pour lutter à ce niveau, surtout face à un Nvidia dont la bonne exploitation du GPU est la spécialité. Qualcomm semble l'avoir bien compris.


Exploiter 2 process pour être présent sur tous les fronts
Le Snapdragon 600 est prévu pour le printemps alors que le Snapdragon 800 devrait débarquer cet été. Comme nous l'indiquions un peu plus haut, ces 2 futurs SoC exploitent des process de fabrication différents. C'est probablement l'un des détails les plus intéressants à observer dans l'annonce de Qualcomm.

Utiliser deux process différents, le 28nm LP et le 28nm HPm (High-K / Metal Gate) demandes des ressources très importantes, tant financières qu'humaines, étant donné que cela implique un redesign des différents blocs des SoC pour prendre en compte leurs spécificités, la création de différents sets de réticules ("masks"), la gestion de différentes allocations de production, la multiplication des composants à tester et à valider… Pourquoi ne pas avoir simplement visé le 28nm HPm ? Interrogé sur la raison de ce choix, Tim McDonough, VP of Marketing, a eu une réponse toute simple : "le 28nm LP est disponible avant le 28nm HPm".

Ainsi, pour Qualcomm, il fait sens d'exploiter deux procédés de fabrication différents si cela permet de gagner ces quelques mois, 3 selon les prévisions actuelles. Un luxe que peu d'acteurs concurrents peuvent se permettre et qui témoigne de la stratégie de la société qui estime disposer de volumes de vente suffisants et s'attaquer à un marché suffisamment mûr pour pouvoir avancer avec une telle segmentation et une évolution progressive des performances, à l'image de ce que nous avons pu observer dans le monde PC lors du pic de concurrence entre AMD et Intel.

De quoi éviter de laisser de l'espace à la concurrence. Qualcomm affirme ainsi que le Snapdragon 600 proposera sous peu un rendement énergétique plus élevé que n'importe quel SoC annoncé à l'heure actuelle, citant indirectement le Tegra 4 et l'Exynos 5 Octa, alors qu'un peu plus tard le Snapdragon 800 augmentera encore ce rendement. Et cette fois il l'associerait à une puissance de calcul tant CPU que GPU suffisamment importante pour pouvoir prétendre à la tête en termes de performances brutes.

Entre les Snapdragon 600/800 de Qualcomm, le Tegra 4 de Nvidia, l'Exynos 5 Octa de Samsung, l'A6X d'Apple, l'Atom Z2580 d'Intel et l'A4 Temash d'AMD, il ne fait aucun doute que la guerre des SoC sera rude en 2013 !

HSA, calcul hétérogène: Intel et Nvidia isolés?

Publié le 04/10/2012 à 16:39 par Damien Triolet

Début juin, AMD inaugurait la HSA Foundation en partenariat avec ARM, Imagination Technologies, MediaTek et Texas Instruments. Cette fondation a pour rappel comme objectif de concevoir des standards dédiés au calcul hétérogène qu'ils concernent l'aspect programmation ou l'implémentation matérielle. Coup sur coup, elle vient d'accueillir de nouveaux membres importants.

ATI, avant d'être englobé par AMD, avait été le premier à nous faire part de l'ambition d'utiliser la puissance de calcul des GPU à d'autres fins que le rendu 3D en temps réel pour lequel ils ont à l'origine été conçus. Probablement par manque de moyens, ces développements ont avancé très lentement et il aura fallu attendre plus d'un an avec la concrétisation de l'initiative similaire de Nvidia pour que le GPU mette enfin un pied dans la porte du monde du calcul haute performance. Disponible dès début 2007, CUDA a ainsi relégué au second plan toute initiative similaire de la part d'ATI/AMD.

Quelques tergiversations au niveau des choix technologiques et des langages de programmation, ainsi que l'intégration d'ATI dans AMD, ont par la suite empêché toute avancée rapide. Il faut dire qu'avec le projet Fusion d'AMD, l'objectif n'était plus simplement d'exploiter le GPU, mais de profiter de la symbiose GPU + CPU. Par ailleurs AMD a fait le choix, probablement par défaut, de se reposer sur des standards ouverts. A l'inverse, Nvidia a opté pour une approche propriétaire qui lui a permis d'être plus agile et surtout beaucoup plus rapide dans ses développements.

Entre le monde x86 largement dominé par Intel, et le calcul sur GPU dominé par Nvidia, AMD s'est retrouvé dans une situation délicate dans laquelle il était devenu difficile de peser sur les choix technologiques des développeurs et donc de les inciter à programmer pour ses solutions hétérogènes.

Pour sortir de cette impasse, AMD avait besoin de rallier d'autres acteurs à sa cause. Proposer un standard d'architecture pour le calcul hétérogène était une solution naturelle à ce problème, d'autant plus qu'il allait devenir essentiel pour de nombreux autres acteurs : les concepteurs de SoC ultra basse consommation. Lorsque l'enveloppe thermique est limitée, comme c'est le cas pour tous les périphériques mobiles, pouvoir exploiter différents types de cœurs destinés au calcul (séquentiel ou massivement parallèle) permet de maximiser les performances dans plus de cas de figure. En d'autres termes, tout l'écosystème ARM était voué à exploiter le calcul hétérogène et allait faire face aux mêmes problèmes qu'AMD lorsqu'il s'agirait de trouver la meilleure approche pour le mettre en place.

Mi-2011, AMD a ainsi proposé la FSA, Fusion System Architecture, comme base de travail, avec en coulisse le support d'ARM. Un an plus tard, après un changement de nom pour HSA, Heterogeneous System Architecture, AMD a remis tous ses travaux initiaux à une fondation dont les membres fondateurs initiaux incluaient également ARM, Imagination Technologies, MediaTek et Texas Instruments. Les statuts de la fondation laissaient cependant la possibilité à d'autres acteurs de devenir des membres fondateurs s'ils se manifestaient dans les 3 mois, à partir du 1er juin 2012.

A quelques jours de l'échéance, Samsung a ainsi rejoint la fondation en tant que sixième membre fondateur, accompagné par Apical, Arteris, MulticoreWare, Sonics, Symbio et Vivante en tant que membres secondaires. Si l'arrivée d'un poids lourd tel que Samsung était une bonne nouvelle pour la HSA, l'absence de Qualcomm était étonnante. Avec des objectifs très importants au niveau des capacités de ses SoC, et l'arrivée à la tête de son département d'ingénierie d'Eric Demers, l'ancien responsable des architectures GPU d'AMD, il ne faisait aucun doute que Qualcomm voudrait rejoindre la HSA… et pas en tant que membre secondaire.

Les négociations ont probablement été plus compliquées et longues que prévues, mais ont fini par aboutir et la HSA Foundation a modifié ses statuts de manière à faire disparaître la date limite pour l'entrée de nouveaux membres fondateurs. Hier, Qualcomm est ainsi devenu le septième membre fondateur.


En s'adjoignant le poids de presque tout l'écosystème ARM, AMD ne pouvait probablement pas trouver de meilleure approche pour le développement d'un standard dédié au calcul hétérogène et la présentation graphique du site de la fondation ne laisse guère de doute concernant le fait que la porte reste ouverte pour un huitième membre principal. S'il faudra encore convaincre certains acteurs importants tels qu'Apple ou Microsoft, les grands absents restent Intel et Nvidia.

Ceux-ci, d'une part par égo vis-à-vis d'AMD et d'autre part pour ne pas faciliter l'arrivée de concurrence sur des marchés très juteux, restent hostiles à l'arrivée d'un tel standard. Intel veut conserver un contrôle total de sa plateforme, proposer ses propres solutions destinées au calcul massivement parallèle et favoriser l'utilisation des cores x86 qui sont en train de gagner beaucoup en efficacité énergétique. De son côté, Nvidia n'entend pas saboter les premiers succès commerciaux de sa division Tesla liée à l'architecture propriétaire CUDA, et prépare sa propre solution hétérogène.

Pour éviter de se retrouver isolés du reste de l'industrie, nul doute cependant qu'Intel et Nvidia vont suivre de très près l'évolution de la HSA ainsi que ses premières spécifications. Annoncées pour fin 2011, elles ont pris du retard mais seraient maintenant entre les mains de l'ensemble des membres de la fondation pour une publication avant la fin de cette année.

Top articles