Nvidia Tegra 3: plus de cores, moins de watts ?

Publié le 14/11/2011 par Damien Triolet

Comme prévu, Nvidia a dévoilé le nom commercial de son SoC jusqu'ici connu sous le nom de code Kal-El : il s'agira de Tegra 3. Pour mettre au point cette puce destinée principalement aux tablettes, mais également aux "gros" smartphones, Nvidia a été plutôt pragmatique et a décidé de faire appel à des technologies déjà éprouvées de manière à arriver plus rapidement sur le marché que la concurrence, notamment Qualcomm et TI.

Tegra 3 se base ainsi en grande partie sur des technologies déjà utilisées dans Tegra 2 dont il reprend les cores CPU ARM Cortex A9 et le GeForce ULV, qui est grossièrement un hybride entre GeForce 6 et 8. Le tout reste également fabriqué sur le même procédé de TSMC : le 40 nanomètres LPG. Bien entendu, les composantes CPU et GPU de ce SoC ont été boostées, Nvidia annonçant un gain de 5x au niveau CPU et un gain de 3x au niveau GPU.

Tegra 3 profite de 4 cores Cortex A9, contre 2 pour Tegra 2, de quoi augmenter significativement la puissance de traitement pour les applications bien multithreadées (typiquement le rendu des pages Internet et les jeux). Nvidia a également intégré un Media Processing Engine d'ARM dans chaque core de manière à supporter le jeu d'instructions vectorielles NEON. Le gain de 5x sur Tegra 2 sera ainsi obtenu dans un cas idéal, qui profite des 2 cores supplémentaires, de l'utilisation de NEON ainsi que de l'augmentation de la fréquence.

Celle-ci est cependant plus réduite que prévu : Nvidia avait annoncé un préalable qu'elle serait de 1.5 GHz avant de se rabattre sur 1.3 GHz avec un mode Turbo à 1.4 GHz quand un seul core est utilisé. Pour rappel, Tegra 2 est cadencé à 1.0 GHz et Tegra 2 3D à 1.2 GHz. Des spécifications revues à la baisse probablement pour contenir l'enveloppe thermique dans un niveau acceptable. Si Nvidia se refuse de communiquer sur cette enveloppe thermique, elle est de toute évidence supérieure à celle de Tegra 2. Sans changement technologique, 4 cores avec NEON à 1.3 GHz sont bien plus gourmands que 2 cores sans NEON à 1 GHz.

Cela veut-il dire que Tegra 3 consommera plus que Tegra 2 ? Oui et non. Oui parce que sa consommation maximale sera plus élevée, mais non parce que sa consommation pratique pourra être globalement plus faible. Outre diverses petites améliorations énergétiques, Nvidia a implémenté dans Tegra 3 un core Cortex A9 compagnon. Similaire aux 4 autres cores, ce dernier est conçu avec des transistors basse consommation : il s'agit là d'une particularité du procédé de fabrication 40 nm LPG de TSMC qui permet sur une même puce de mélanger des transistors optimisés pour les performances (fréquence) et pour la consommation.

Le die, relativement gros, de Tegra 3 avec ses 5 cores. Attention, il ne s'agit pas d'une photo réelle, mais d'une représentation artistique, le cinquième core étant signé Photoshop.

Ce core compagnon, très économe et qui ne pourra pas dépasser 500 MHz, peut être vu comme le core principal de Tegra 3. En cas de demande de plus de puissance de traitement il s'effacera au profit des 4 autres cores et reprendra le contrôle une fois leur travail terminé. Une transition qui n'est cependant pas gratuite puisqu'elle nécessite 2ms, imperceptible au niveau de l'utilisateur mais une éternité en temps CPU. Le système de contrôle mis en place par Nvidia s'assurera ainsi de n'opérer ce changement d'état que lorsqu'il est réellement utile pour éviter des aller-retours incessants entre le core compagnon et les 4 cores plus puissants, ce qui aurait pour conséquence de réduire les performances et d'augmenter la consommation, soit l'inverse du but recherché.

Cette approche, baptisée vSMP (Variable Symultaneous Multi-Processing), est inspirée autant de big.LITTLE d'ARM que de la stratégie HUGS (Hurry Up and Go to Sleep) d'Intel et AMD et permet à Tegra 3 de proposer un mix plutôt intéressant, tout du moins sur le papier, entre puissance de traitement et consommation.

Ce core compagnon est par exemple suffisant pour soutenir l'unité de décodage des vidéos, ce qui permet à Tegra 3 d'être plus économe en lecture vidéo que Tegra 2. Notez à ce sujet que le moteur vidéo a été mis à jour pour supporter les flux h.264 high profile jusqu'à 40 mbps, Tegra 2 étant limité au main profile 20 mbps. Tegra 3 est ainsi compatible avec les Blu-ray, mais pas encore avec les Blu-ray 3D qui demandent 60 mbps.

La partie GPU reçoit elle aussi plus de cores. Alors que Tegra 2 dispose de 4 cores pour le traitement de la géométrie (vertex shader) et de 4 cores supplémentaires dédiés au calcul des pixels (pixel shader et blending), Tegra 3 voit ce dernier nombre doubler. Une évolution logique qui permet de mieux s'adapter à la résolution des écrans des tablettes et de permettre aux développeurs d'ajouter assez facilement quelques effets graphiques supplémentaires. Notez que contrairement aux GPU pour PC, ainsi qu'à d'autres GPU concurrents dans le monde des SoC, Nvidia a opté pour une architecture non-unifiée. Celle-ci permet de simplifier les cores GPU, notamment au niveau de la précision des unités de calcul, adaptée à chaque type de tâches, au prix du non-support de certaines techniques de rendu plus avancées ainsi que du calcul hétérogène via OpenCL.

Il est ainsi paradoxal de constater que Nvidia, le spécialiste de la 3D sur PC, se contente pour ses SocS d'un GPU relativement modeste, et à l'architecture condamnée, alors que nous aurions pu nous attendre à ce que Nvidia décide de frapper fort à ce niveau. Ce choix s'explique probablement par la nécessité première de réduire la consommation énergétique. Nvidia ayant plus d'expérience du côté GPU que de nombreux concurrents, tant au niveau logiciel que des petites optimisations d'architecture qui font la différence, il lui est possible d'en profiter pour faire beaucoup avec peu et dégager ainsi plus de marge pour la partie CPU.

Le doublement du nombre d'unités dédiées au calcul des pixels ainsi que quelques petites optimisations et une augmentation de la fréquence GPU (qui passe probablement de 333 à 400-450 MHz) permettent à Nvidia d'avancer un gain de 3x sur Tegra 2. De quoi donner plus de possibilités aux développeurs de jeux vidéo orientés mobile, comme vous pouvez le constater dans les deux exemples présentés par Nvidia avec Riptide et Shadowgun.

Reste un point faible hérité de Tegra 2 : le sous-système mémoire. Alors que la concurrence opte souvent pour un contrôleur mémoire double canal, Nvidia se contente toujours d'un seul canal et malgré le doublement du nombre de cores CPU, le cache L2 reste limité à 1 Mo. Le support de la mémoire passe cependant de la LPDDR2-600 à la LPDDR2-1066 ainsi qu'à la DDR3L-1500, soit le strict minimum pour éviter que ce SoC ne soit trop limité par son interface mémoire. Nvidia a par contre intégré directement sur le SoC un contrôleur SATA II, ce qui facilitera l'ajout d'un disque dur ou d'un SSD, par exemple dans de futurs netbooks qui viseront Windows 8.

Avec une utilisation efficace des technologies actuelles, Tegra 3 devrait être une solution très intéressante pour les tablettes grâce à une avance de 3 à 6 mois sur la concurrence. Pour disposer d'une tablette compacte et relativement puissante, il n'y a pas d'alternative à court terme, à moins de lorgner du côté x86, mais avec une consommation qui n'est pas comparable. A Nvidia bien entendu de tenir toutes ses promesses et aux partenaires de proposer des designs intéressants. Cela semble être le cas de la Transformer Prime d'Asus, plus fine et plus légère que la Transformer, tout en profitant de la puissance supplémentaire offerte par Tegra 3. Reste que cette première tablette Tegra 3 a été repoussée au mois prochain, officiellement en raison d'un retard lié à Android 4.0. Espérons pour Nvidia que ce retard n'augmente pas puisqu'il réduit directement la fenêtre du net avantage compétitif de Tegra 3 alors que l'augmentation de la fréquence prévue courant 2012 (Kal-El+) ne sera probablement pas suffisante pour lutter contre les SoC à base de Cortex A15 et fabriqués en 28nm.

La tablette Asus Eee Pad Transformer Prime et son dock.

Quant aux smartphones, la donne est plus compliquée, notamment parce que l'enveloppe thermique de Tegra 3 est plus difficile à concilier avec le design bien plus compact d'un smartphone. Si Nvidia indique que des modèles à base de Tegra 3 sont en préparation, ils devraient être peu nombreux, limités au très haut de gamme. Une version dualcore de Tegra 3 pourrait par contre s'avérer intéressante pour profiter de ses avantages dans une enveloppe thermique plus réduite. Là encore, Nvidia restera cependant cantonné à une petite niche mais qui lui permettra de se positionner d'une manière intéressante pour l'arrivée de Grey en 2013, un SoC qui fusionnera Tegra à un baseband Icera. Une solution intégrée qui devrait enfin permettre à Nvidia de prendre place dans un plus grand nombre de smartphones.

A lire également