Les contenus liés au tag Tegra

Afficher sous forme de : Titre | Flux Filtrer avec un second tag : AMD; ARM; CUDA; GTC; Kepler; Logan; Nvidia; Tegra 3; Tegra 4; Tegra 4i;

Kepler mobile & Logan: l'offensive de Nvidia

Tags : Kepler; Logan; Nvidia; Tegra;
Publié le 24/07/2013 à 16:15 par Damien Triolet

Visiblement très actif lors de ce SIGGRAPH, Nvidia vient d'en dévoiler un petit peu plus au sujet de la variante ultra mobile de Kepler. Ce GPU prendra place dans le SoC Logan, probablement le futur Tegra 5, et viendra également concurrencer directement les PowerVR d'Imagination et autres Mali d'ARM.

Deux démonstrations techniques mettent tout d'abord en avant des capacités de rendu proches de ce qui se fait sur PC. Nvidia nous précise en effet que les fonctionnalités sont similaires à celles des gros GPU PC, que ce soit au niveau du support de DirectX 11.x (niveau 11_0), d'OpenGL 4.x, d'OpenCL ou encore du CUDA. Une révolution par rapport à OpenGL ES 2.0 qui limite les Tegra 2, 3 et 4 !


La première démonstration est une version simplifiée du rendu de visage réaliste qui avait été présentée à la GDC en mars dernier : FaceWorks Mobile. Cette démonstration avait été initialement faite sur base d'une GeForce GTX Titan et pour le SoC Logan, Nvidia a réduit la résolution et la qualité de certains effets de manière à conserver le principal tout en s'adaptant à un GPU annoncé comme capable de tenir dans une enveloppe thermique de 2W :



La seconde démonstration met de son côté en avant le support complet d'OpenGL 4.3 et d'effets tels que la tessellation, particulièrement utile dans le monde mobile puisqu'elle permet de réduire les transferts de données, plus énergivores que les opérations traitées par le GPU pour générer des triangles supplémentaires :



Ces démonstrations ne nous donnent pas de réelles indications concernant le niveau de performances du GPU de Logan, mais mettent par contre en avant le fait qu'il supporte bien toutes les dernières techniques de rendu et que son support logiciel est déjà bien avancé. En réalité, selon nos informations, cela fait plusieurs années que les développeurs de Nvidia préparent son support à travers une unification du cœur des pilotes entre les divisions GeForce et Tegra.

Nvidia ne rentre pas dans les détails techniques, ceux-ci seront dévoilés plus tard, mais parle malgré tout d'un GPU équipé de 192 unités de calcul (les "cores" en mauvais langage commercial) dérivées de l'architecture Kepler des GeForce 600 et 700. Notez que c'est différent de ce qui avait été sous-entendu au départ par Nvidia puisque ce dernier avait indiqué que la plateforme Kayla, destinée à émuler le SoC Logan, était associée à un GPU Kepler similaire équipé de 384 unités de calcul (le GK208).

Sans précision sur le détail de l'architecture, il est difficile de savoir comment sont organisées ces unités de calcul, cela pourrait être un seul SMX similaire aux GPU Kepler classiques ou quelque chose de totalement différent. Tout comme le récent GPU d'entrée de gamme de la marque, le GK208, il semble toutefois évident que le nombre d'unités de texturing sera proportionnellement réduit par rapport aux autres GPU Kepler. Ces unités sont liées à un flux de données continu, ce qui implique une dépense d'énergie importante. Les 192 unités de calcul de Kepler mobile seront ainsi probablement associées à 8 voire 4 unités de texturing.

Pour pouvoir tenir dans une enveloppe de 2W, Nvidia a également dû optimiser différents aspects de son GPU et mentionne par exemple une interconnexion interne revue. Celle-ci étant à la base conçue pour permettre à un nombre important de blocs d'unités de toutes sortes de communiquer entre elles, il semble logique que certaines simplification soient possibles à ce niveau pour un petit GPU. Pour le reste, il n'est pas impossible que la précision de calcul soit réduite quand toutes les unités sont exploitées, que certains datapaths ait été réduits en largeur ou que le débit de certaines unités ait été revu à la baisse. Certains compromis sont bien entendu nécessaires et ont été prévus lors du développement de l'architecture pour pouvoir faire passer Kepler de 250W dans une GeForce GTX Titan à 25W pour une GeForce GT 630 et à 2W pour le GPU de Logan.


Pour illustrer la puissance de ce GPU mobile, Nvidia nous fournit un graphe assez vague qui compare ce qui serait la puissance de calcul brute. Kepler mobile est décrit sur ce graphe comme étant 5x plus performant que le PowerVR SGX 554MP4 de l'iPad 4 et légèrement plus performant qu'une GeForce 8800 GTX, le haut de gamme de fin 2006. Nous n'en tirerons aucune conclusion puisque s'il s'agit bien de la puissance de calcul, elle serait alors de +/- 384 Gflops, ce qui correspondrait à un GPU Kepler mobile cadencé à 1 GHz. Une telle fréquence nous semble peu compatible avec les 2W annoncés par Nvidia et correspond probablement à une version du SoC avec TDP plus élevé. A l'opposé des performances maximales, Nvidia nous indique également que lorsque ce GPU est cadencé de façon à offrir les mêmes performances que celles du GPU de l'iPad 4, sa consommation est alors trois fois moindre.

Par ailleurs, il faut garder en tête que les performances en pratique d'un GPU ne dépendent pas exclusivement de sa puissance de calcul. La puissance de texturing et la bande passante mémoire sont deux éléments cruciaux qui devront faire avec les contraintes d'une enveloppe thermique compressée autant que possible. Le niveau de performances en pratique devrait plutôt se situer entre celui des GeForce 8600 GT et 9600 GT, suivant les versions, ce qui est déjà très bien.

Que retenir de tout cela ? Entre une démonstration simplifiée qui tourne sur un GPU simplifié et des détails techniques très vagues, l'annonce de Nvidia peut être vue comme une coquille vide, une tentative de démarrer du hype sur base de peu de choses. Si ce dernier aspect n'est pas à négliger, l'annonce de Nvidia est cependant loin d'être insignifiante.

Alors que ce SoC Logan est attendu dans le commerce au printemps prochain, les démonstrations de Nvidia représentent un avertissement clair à la concurrence : sa plateforme de développement est prête, l'environnement logiciel est prêt et les développeurs vont pouvoir facilement porter des graphismes plus évolués tirés du monde PC ou des consoles vers les périphériques mobiles.

Les concurrents principaux de Nvidia au niveau des GPU mobiles, Qualcomm (Adreno), Imagination (PowerVR) et ARM (Mali) ont depuis quelques années systématiquement une avance technologique sur Nvidia au niveau de leurs GPU. Ils dominent également largement le marché. Mais pourtant, sur le plan graphique, ils ne sont pas réellement parvenus à transformer leurs avantages sur le papier dans la pratique, soit par manque de moyens investis pour convaincre les développeurs de tirer le maximum de leur GPU, soit par une arrivée très tardive de pilotes complètement, voire même partiellement, fonctionnels.

Nvidia a probablement été clairvoyant et pragmatique à ce niveau en se contentant jusqu'ici de relativement peu sur le plan matériel pour ses GPU mobiles. De quoi pouvoir attribuer plus de ressources sur d'autres fronts en se contentant de son expérience dans le monde graphique pour préparer calmement l'arrivée d'une offensive enfin digne de la marque GeForce.

Cette offensive ce sera Logan. En profitant de son expérience et d'un GPU cette fois plus que compétitif, Nvidia compte bien s'affirmer comme la référence pour le jeu mobile et profiter de l'explosion de ce marché pour convaincre une part plus significative des fabricants de smartphones et tablettes de faire confiance aux SoC Tegra… ou tout simplement au GPU GeForce mobile/ULP. Il y a peu, Nvidia a en effet indiqué clairement que son GPU Kepler mobile serait disponible sous licence pour d'autres fabricants de SoC. Nul doute que l'annonce d'aujourd'hui pose la base d'une stratégie destinée à convaincre les partenaires d'Imagination ou d'ARM de changer de crèmerie !

Licences GPU: guerre AMD-Nvidia en vue ?

Publié le 19/06/2013 à 15:11 par Damien Triolet

A travers son blog , Nvidia vient d'indiquer une nouvelle fois être en train de préparer la mise à disposition sous licence de ses technologies liées aux GPU. Nous précisons "une nouvelle fois" puisque Jen-Hsun Huang, le CEO de la société, avait déjà annoncé cela fin mars lors d'une conférence aux investisseurs.


A partir de la génération Kepler mobile, qui sera introduite avec le SoC Tegra dénommé Logan, d'autres acteurs pourront avoir accès au GPU Nvidia en vue de l'intégrer dans leurs propres SoC. Nvidia va donc pouvoir concurrencer directement ARM (Mali), Imagination Technologies (PowerVR) et quelques autres acteurs secondaires, sur le plan des propriétés intellectuelles mises à disposition de l'industrie. CUDA en fera bien entendu partie même si nous pouvons supposer qu'il s'agira d'une option proposée en supplément.

Une manière pour Nvidia d'augmenter la part de marché représentée par ses GPU et bien entendu d'augmenter ses revenus en allant toucher d'autres clients. Si la qualité de son ensemble GPU et écosystème logiciel n'est pas à démontrer, la difficulté pour Nvidia sera probablement de convaincre les clients potentiels (Apple, Samsung…) de lui faire confiance dans la durée. Nvidia a pour habitude d'être très agressif en affaires, ce qui fait partie des raisons de son succès, et sera qui plus est en concurrence directe avec ses éventuels clients. Ainsi, Nvidia devra probablement leur garantir d'une manière ou d'une autre que ses propres SoC ne seront pas privilégiés que ce soit au niveau de petites différences d'architecture, des pilotes etc.


Les médisants verront dans cette évolution l'échec relatif des SoC Tegra de Nvidia. Si cela fait probablement partie des raisons, puisque ces derniers peinent à prendre des parts de marché significatives face au leader du domaine (Qualcomm) alors qu'Intel est en train d'arriver en force, nous y voyons également une manière de tenter de contenir AMD. Même si Nvidia n'est pas prêt à s'abaisser à admettre être inquiété par ce dernier, il ne fait aucun doute que l'intégration de technologies graphiques dérivées des Radeon dans toutes les consoles du marché est une menace.

Par ailleurs, il convient de ne pas confondre le temps des annonces et le temps des actions. En mars, juste avant que Jen-Hsun Huang n'indique discrètement que la mise sous licence de ses GPU allait arriver, des rumeurs intéressantes ont commencé à circuler : Qualcomm pour ses GPU Adreno et ARM pour ses GPU Mali seraient entrés en négociation avec AMD en vue de l'intégration future d'une variante mobile de l'architecture GPU GCN. Des rumeurs qui sont devenues insistantes lors de la GDC.

Pour AMD, qui mise beaucoup sur l'utilisation flexible de ses propriétés intellectuelles, il s'agit d'une évolution plus que logique. Rappelons que les GPU Adreno (anagramme de Radeon) ont été conçus par la division Imageon d'ATI/AMD, que Qualcomm a englobée. Par ailleurs, AMD, ARM, Qualcomm, Samsung, Imgagination, …, ont formé un consortium, le HSA Foundation, chargé de poser un socle commun pour le GPU Computing.

AMD est ainsi plus que bien positionné pour fournir des GPU mobiles sous licence, et si aucune annonce officielle n'a été faite jusqu'ici, il n'est pas impossible que celle de Nvidia soit une réaction à des mouvements qui demeurent jusqu'ici silencieux.

GTC: Performances GPU de Logan = GT 640M ?

Publié le 26/03/2013 à 06:25 par Damien Triolet

Durant la GTC 2013, nous avons pu nous entretenir avec Ian Buck qui est à l'origine de la première version de CUDA et actuellement General Manager chez Nvidia pour les technologies du GPU Computing. Interrogé au sujet de Kayla, la plateforme de développement CUDA on ARM équipée d'un GPU GK208, Ian Buck nous a indiqué que les performances GPU, au niveau de CUDA, étaient bel et bien représentatives de celles de Logan, sans vouloir en dire plus.


Bien que ce niveau de performances représente le bas de gamme sur PC, il s'agit d'une évolution énorme pour un SoC Tegra. Si le passage au 20nm et sans aucun doute plusieurs évolutions de l'architecture (avec probablement une réduction du nombre d'unités de texturing), faciliteront l'arrivée de l'architecture Kepler et de CUDA dans le monde ultra-mobile, il est difficile d'imaginer que ces 384 cores (ou équivalents) flexibles ne consommeront pas plus que les 72 cores avec pipeline fixe de Tegra 4.

De quoi nous laisser spéculer qu'avec Logan, Nvidia devra se contenter de versions bridées (en termes d'unités actives ou de fréquences) pour les "petites" tablettes et les superphones, mais compte par contre revoir ses prétentions à la hausse avec un SoC capable de monter en gamme pour viser les "grosses" tablettes voire des ultra-portables et bien entendu le successeur de Shield.

Parallèlement à cela, Ian Buck nous a indiqué que CUDA devrait progressivement devenir "power aware" et devenir capable de prendre en compte l'aspect consommation ou tout du moins de permettre aux développeurs de le faire. Cela se fera tout d'abord au niveau des outils tels que Nsight (et sa version Tegra) qui d'ici quelques temps reporteront des informations liées à la consommation.

Il est possible qu'à terme, les compilateurs CUDA, permettent optionnellement d'améliorer le rendement énergétique, mais cela est encore à l'état de recherche et prendra encore plusieurs années avant d'éventuellement se concrétiser. Globalement, la meilleure stratégie reste d'exécuter le plus rapidement une tâche pour retourner au repos dès que possible mais ce n'est pas toujours vrai, d'autant plus dans le cas d'une tâche continue telle que le rendu 3D sur GPU. Par exemple, calculer une valeur au lieu de la lire en mémoire peut avoir un léger impact sur les performances mais augmenter le rendement énergétique.

En plus de préparer le futur avec CUDA, dans l'immédiat, le plus important pour Nvidia est probablement d'arriver à convaincre un maximum de développeurs que faire l'effort nécessaire pour arriver à utiliser 2 threads ou plus à fréquence modérée offre un meilleur rendement que se contenter d'un seul thread mais des performances de la fréquence CPU maximale.

Correction du 01/07/2013: le nom du GPU que nous pensions être GK117 est en réalité GK208.

GTC: 5W Pour Tegra 4 et 1W pour Tegra 4i ?

Publié le 26/03/2013 à 04:24 par Damien Triolet

Lorsque nous avions rencontré Nvidia pour parler de l'architecture des Tegra 4 et 4i, il y a un point que le concepteur de ces SoC a catégoriquement refusé d'aborder : la consommation en charge et le TDP. Des chiffres délicats à avancer et à assumer puisque de toute évidence, la consommation maximale de Tegra 4 sera supérieure à celle de Tegra 3. Ceci n'étant bien entendu pas incompatible avec un rendement énergétique supérieur et avec une consommation en baisse lors de scénarios de types charge faible.


Lors d'une présentation dédiée aux investisseurs qui a suivi la keynote principale de la GTC, Jen-Hsun Huang, CEO de Nvidia, a avancé des chiffres concernant les TDP des futurs SoC : 5W pour Tegra 4 et 1W pour Tegra 4i. Deux chiffres relativement faibles, voire très faibles dans le cas du Tegra 4i qui intègre pour rappel 4 Cortex-A9 r4, un GPU relativement véloce et un modem 4G/LTE.

Pour comprendre ces chiffres, il faut cependant savoir que la définition du TDP est à géométrie variable, comme nous l'avions expliqué en nous intéressant de plus près au SDP d'Intel. Globalement le TDP représente la capacité de refroidissement nécessaire pour garantir le bon fonctionnement du composant. Historiquement cela représentait sa limite haute de consommation, mais progressivement, le fait de pouvoir fonctionner à une fréquence réduite pour éviter une surchauffe a été intégré à la définition même de "bon fonctionnement". Ajoutez-y les modes turbo et la prise en compte de l'inertie thermique et vous comprendrez qu'il devient difficile d'interpréter l'impact exact du TDP sur la consommation et sur les performances.

Les chiffres de 5W et de 1W avancés par Nvidia représentent ainsi probablement la capacité de dissipation nécessaire pour les variantes les moins gourmandes de Tegra 4 et de Tegra 4i. Des chiffres qui permettent de se faire une idée des types de designs et de formats qui pourront accueillir ces composants. De quoi confirmer que Tegra 4 est plutôt adapté à une tablette alors que Tegra 4i pourra être intégré facilement dans des smartphones compacts.

Difficile de dire par contre quel sera le niveau de performances soutenu autorisé par ces TDP puisqu'il est probable, comme c'est le cas pour la plupart des SoC actuels, que les Tegra 4 et 4i soient autorisés à consommer plus que cette valeur, jusqu'à atteindre une certaine température et voir leurs fréquences réduites. En plus de ces TDP, soit de la capacité de dissipation requise, il serait ainsi intéressant de connaître la capacité de dissipation conseillée par Nvidia pour pouvoir tirer le meilleur de ces SoC en termes de performances, notamment en ce qui concerne le jeu qui représente l'une des tâches les plus gourmandes qu'ils auront à exécuter.


Enfin, notez que le CEO de Nvidia a précisé le timing de l'entrée en production des périphériques qui intégreront ces futurs SoC : Q2 2013 pour Shield, les tablettes et les superphones Tegra 4, Q4 2013 pour les tablettes Tegra 4 + modem i500 et enfin Q1 2014 pour les smartphones Tegra 4i (i500 intégré).

GTC: Le futur de Tegra: CUDA, Logan, Parker

Publié le 19/03/2013 à 20:27 par Damien Triolet

Après la roadmap GeForce, Nvidia nous en a dit un peu plus sur la roadmap des SoC Tegra. Si certains ont été quelque peu déçus de ne pas retrouver un GPU plus moderne dans Tegra 4, cela est en passe de changer. Jen-Hsun Huang a ainsi confirmé que la prochaine architecture Tegra, Logan, intégrerait enfin une évolution GPU majeure qui fera le pont avec les technologies qui nous retrouvons dans la gamme GeForce traditionnelles.


Ainsi, le GPU de Logan sera dérivé de l'architecture Kepler avec un support complet d'OpenGL 4.3 et surtout de CUDA 5 pour permettre d'exploiter la puissance de calcul du GPU d'une manière plus flexible, par exemple pour le traitement d'images. En plus de sa plateforme propriétaire CUDA, nul doute que Nvidia supportera également la plateforme ouverte OpenCL, qui, dernièrement, a enfin reçu un support clair de la part de Google en ce qui concerne Android.

Pour le reste, il est probable que Logan reprenne les mêmes cores Cortex-A15 que Tegra 4 et soit fabriqué en 20 nanomètres. Jen-Hsun Huang a précisé que si Tegra 4 est arrivé en retard, Tegra 4i est de son côté arrivé légèrement en avance alors que Logan devrait être à l'heure avec des premiers prototypes à la fin de l'année et une production qui débutera début 2014. Vous pouvez donc vous attendre à une annonce de Tegra 5 au CES 2014.

Tout ceci n'est cependant qu'une confirmation de ce que nous supposions déjà. La nouveauté est l'arrivée de quelques premières informations sur le successeur de Logan : Parker. Ce dernier arrivera en 2015 et intègrera les premiers cores ARM conçus en interne par Nvidia et basés sur l'architecture ARMv8 qui supporte le 64-bit, nom de code Denver. Au niveau du GPU, Parker passera à la génération Maxwell, avec seulement une année de décalage par rapport aux gros GPU dekstop, les architectures GPU étant dorénavant unifiées entre les différentes divisions de Nvidia.

Parker devrait également être la première puce conçue par Nvidia en vue de l'utilisation d'un procédé de fabrication de type FinFET ("transistors 3D) et nous pouvons supposer qu'il s'agira alors du 14nm.

Top articles