Les derniers contenus liés au tag Tegra K1

Nvidia rappelle les Shield Tablets : risque d'incendie

Tags : Nvidia; Tegra K1;
Publié le 31/07/2015 à 15:02 par Damien Triolet

Nvidia vient s'ajouter à la liste des fabricants touchés par des problèmes de batterie et annonce aujourd'hui un rappel volontaire des tablettes Shield dont la batterie pourrait surchauffer et entraîner un risque d'incendie.

Comme vous pouvez l'imaginer compte tenu des aspects légaux, Nvidia en dit le moins possible mais conseille de suivre la procédure d'échange et de cesser d'utiliser la tablette, même si en pratique les risques sont probablement infimes.


Les tablettes affectées ont été commercialisées entre juillet 2014 et juillet 2015, soit depuis le lancement de la Shield Tablet jusqu'à ce jour. Il existe par contre 2 variantes de la batterie : la B01 ne pose pas de problème contrairement à la Y01 qui doit être remplacée. C'est le cas pour notre échantillon de Shield Tablet.

La procédure de retour est assez simple : la dernière mise à jour de la tablette permet de vérifier la version de la batterie et d'activer le remplacement si nécessaire. Nvidia fera alors parvenir une tablette corrigée et l'ancienne sera renvoyée par la suite (elle sera désactivée en se connectant aux serveurs Nvidia dès que la nouvelle sera activée).

Nvidia a mis en place un site internet pour procéder au rappel et expliquer étape par étape la procédure à suivre : http://fr.tabletrecall.expertproductinquiry.com/registration .

Nvidia présente Denver

Publié le 13/08/2014 à 13:10 par Guillaume Louel

Après une annonce quelque peu confuse au CES d'un Tegra K1 en deux versions, Nvidia a profité de la conférence Hotchips pour donner quelques petits détails sur son architecture processeur Denver.


Pour rappel, Denver est une implémentation customisée de l'architecture 64 bits ARMv8. Il s'agira des premiers cores ARM custom proposés par Nvidia qui utilisait jusqu'ici des cœurs génériques ARM (Cortex-A9 dans Tegra 3, Cortex-A15 dans Tegra 4, etc…) dans ses puces Tegra. Il s'agit de la seconde architecture ARMv8 custom présentée pour l'instant, la première étant celle d'Apple (Cyclone) utilisée dans les ses SoC A7. En pratique, une version spéciale des Tegra K1 sera disponible avec deux cœurs Denver (contre quatre cœurs Cortex-A15 pour la version 32 bits du Tegra K1).

La présentation de Nvidia ne rentre pas forcément dans un très haut niveau de détails, mais l'on y trouve quelques grandes lignes intéressantes. D'abord sur les unités d'exécution :


Nvidia présente ce slide qui met face à face les unités d'exécution d'un cœur Cortex-A15 et d'un cœur Denver. On retrouve certains changements liés à ARMv8 comme le passage des unités Neon/FP (les instructions SIMD d'ARM) de 64 à 128 bits, et d'autres plus intéressants. On retrouve sept ports qui incluent un plus grand nombre d'unités, par exemple au lieu d'un seul port pour les Load et les Stores, les deux ports sont capables d'effectuer les deux types d'opération, et aussi des instructions entières. Le détail le plus important concerne surement le décodeur qui indique une phase de « prédécodage ».

De manière classique sur les Cortex-A, les instructions ARM sont décodés, réordonnées, (le principe de l'OoO, Out of Order), les registres sont renommés, puis les instructions sont dispatchées aux unités d'exécution. A l'inverse chez Intel, le jeu d'instruction x86 étant très large, les instructions x86 sont traduites en micro opérations - une sorte de jeu d'instruction réduit, interne aux unités d'exécutions – avant de subir les mêmes opérations de changement d'ordre, renommage de registres et de dispatch. Le prédécodage laisse penser que Denver utilise lui aussi un jeu d'instruction interne différent. Plus surprenant, Denver pourrait être une architecture hardware in-order.

C'est en tout cas ce que laisse penser la fonctionnalité la plus originale de Denver, ce que Nvidia appelle « Dynamic Code Optimization ». En pratique, il s'agit d'une couche logicielle qui fonctionne dans un espace mémoire (128 Mo) protégé, géré directement par le firmware et qui n'est pas accessible au système d'exploitation. Ce code logiciel fait tourner des threads cachés du reste du système dans ce que Nvidia appelle des « hidden time slices », on suppose qu'il s'agit d'un contexte dédié à l'utilisation de DCO. Que fait donc cet optimiseur ?


La liste des opérations ne trompe pas, on retrouve ici toutes les opérations effectuées par les frontend des processeurs Out of Order modernes, comme le réordonnancement d'instructions ou le renommage de registre. On trouve même quelques fonctionnalités un peu plus avancées que l'on a déjà vues chez Intel et AMD comme le dépliage de boucles.


En pratique le fonctionnement est – d'après les informations que nous avons - ainsi : le code ARM est décodé en micro instructions puis envoyé directement aux unités d'exécution. En parallèle, ce code est envoyé aux threads cachés DCO qui vont effectuer un décodage « OoO » optimisé du code ARM en micro instructions (l'optimisation est effectuée en profitant d'informations de profilage statique récupérées par l'exécution du code). Ce code est ensuite stocké dans le cache en mémoire principale de 128 Mo que nous évoquions plus tôt. La prochaine fois que ce segment de code se représentera, le code optimisé en micro instructions est récupéré du cache mémoire et exécuté directement à la place du code décodé en hardware.

Pour résumer tout cela en une phrase, Denver implémente de manière logicielle l'OoO d'habitude implémentée de manière matérielle dans les autres processeurs. Si cela vous dit quelque chose, c'est probablement parce que ce type de design avait été utilisé par Transmeta pour ses Crusoe. Une différence notable avec les Crusoe est que Denver peut exécuter directement le code ARM via un décodeur matériel (de manière moins performante, et nous le supposons, in-order). En supprimant un frontend couteux en transistors, on peut sur le papier disposer d'une plus grande marge de transistors à placer ailleurs (unités d'exécution ou même GPU), ou réduire la consommation. A l'inverse, une architecture « in-order » n'est pas, lorsqu'elle est en fonctionnement, particulièrement efficace d'un point de vue énergétique lorsqu'elle doit attendre après des instructions mémoires.

Reste que si ce genre d'architecture peut être très efficace dans des benchmarks arithmétiques, en pratique tout dépendra de la variété de code utilisée et de l'efficacité de cet « OoO » logiciel. DCO semble capable de travailler sur des blocs de taille variables pouvant aller jusqu'à 1000 micro opérations. Nvidia a ajouté un cache d'instruction de niveau 1 de 128 Ko qui peut contenir les blocs les plus utilisés, tandis que les autres seront stockés en mémoire (beaucoup plus lente) en attente d'être exécutés de nouveau.


Nvidia donne un exemple du fonctionnement en pratique. Sur ce schéma, on peut voir en haut en vert le « type » d'exécutions qui ont lieu sur les cœurs Denver durant le début d'un benchmark SpecINT 2k. Malheureusement, il n'y a pas d'échelle de temps mais l'on note en vert les instructions optimisées, en vert pale les instructions décodées en hard, et en pourpre/violet les instructions exécutées par DCO. Leur nombre est non négligeable particulièrement en début de benchmark. La proportion d'instructions issues du décodeur matériel décroit au fur et à mesure, remplacées au fur et à mesure par des instructions « optimisées ». On peut voir l'augmentation de l'IPC au fur et à mesure en bas.

L'architecture de Denver est pour le moins originale et les quelques détails donnés durant la conférence Hot Chips ne permettent pas vraiment de se faire une idée des performances réelles de la puce. Nvidia avance quelques benchmarks ou il place, dans des tests arithmétiques (et donc répétitifs, le cas le plus avantageux pour ce type d'architecture), Denver au niveau d'un Celeron Haswell 2955U (1.4 GHz, 15 watts) sans préciser le TDP ou la fréquence du Denver utilisé. Les performances dans un environnement réel ou cohabitent de multiples applications dont le code n'est pas forcément fait de traitements répétitifs dépendront de l'efficacité de cet OoO logiciel. La taille du cache d'instruction et sa rapidité pouvant devenir une ressource critique pour les performances.

La disponibilité des K1 Denver n'a pas été précisée, indiquée simplement à « plus tard cette année » par le constructeur.

Nvidia passe sa Shield au format Tablette

Publié le 22/07/2014 à 15:00 par Marc Prieur

Après la Nvidia Shield lancée début 2013, qui est au passage renommée en Shield Portable, Nvidia lance une nouvelle version, la Shield Tablet, qui est toujours sous Android. Cette fois le format est plus classique puisqu'il s'agit d'une tablette 8" dotée d'un écran full HD 1920x1200 en IPS.


Le cœur de la bête est constitué d'un Tegra K1. Annoncé en début d'année, ce SoC intègre pour rappel 4 cœurs Cortex-A15 32 bits, comme sur le Tegra 4, mais le GPU évolue fortement et est basé sur l'architecture Kepler avec 192 "cores" (1 SMX) et un niveau de fonctionnalité de type Direct3D 11_0 / OpenGL 4.4 / OpenGL ES 3.1 / Android Extension Pack.

Elle intègre par ailleurs deux hauts parleurs, un port micro SD, deux caméras 5 Megapixels et gère le WiFi 802.11 a/b/g/n ainsi que le Bluetooth 4.0 LE. Un GPS est intégré ainsi qu'un capteur de mouvement ainsi qu'un stylet. La sortie vidéo est de type mini HDMI 1.4a et un port micro USB 2.0 est présent, la tablette supporte par ailleurs les casques micro et intègre une batterie Lithium ion de 19.75 watt heure.


Deux versions sont prévues, une version 16 Go à 299$ et une 32 Go avec LTE à 399$, les deux seront disponibles en Europe mi-août avec en option un étui à 39$ permettant de la tenir à la verticale. Mais quel rapport avec Shield me direz-vous ? Pour Nvidia plus qu'une tablette il s'agit d'une console à associer au Shield Controller, une manette reliée en WiFi (4 peuvent être utilisées en même temps) ou en filaire via une prise micro USB 2.0 qui est également utilisée pour le rechargement de la batterie Li-ion. Vendue à l'unité 59$, elle dispose également d'un port permettant de connecter un casque avec micro.

Comme la Shield Portable, la Shield Tablette supporte Nvidia Gamestream qui permet de streamer les jeux d'un PC Windows équipé d'une GeForce vers la Shield, ainsi que GRID Cloud Gaming qui permet de jouer à des jeux qui tournent sur des serveurs distants (beta version réservée aux USA et limitée à 16 jeux). Elle intègre par contre une nouveauté destinée aux joueurs qui était réservée aux GeForce jusqu'alors, ShadowPlay qui permet un encodage H.264 à peu de frais en vue d'un streaming des parties sur Twitch par exemple.


A noter que la Shield Portable n'est pas oubliée puisqu'elle bénéficiera de certaines mises à jour applicatives lors du lancement de Shield Tablet (améliorations de Shield App et de Gamestream) et supportera les Shield Controller.

Ecarté des consoles "classiques", Nvidia continue d'essayer de proposer des alternatives. Alors que la Shield initiale n'avait été lancée qu'outre atlantique, cette fois la Shied Tablet a droit à un lancement en Europe le 14 août après les USA et le Canada le 29 juillet, d'autres régions devant suivre à la rentrée. Reste à savoir si cet élargissement et les nouveautés apportées permettront à Nvidia d'obtenir de meilleurs résultats pour cette nouvelle Shield, la première version ayant enregistré des ventes "modestes" de l'aveu de Jen-Hsun Huang, CEO de Nvidia.

Focus : Nvidia Tegra K1 et son GPU Kepler : les details

Publié le 06/01/2014 à 15:20 par Damien Triolet

Enfin, après plusieurs générations de SoC basés sur un GPU à l'architecture vieillissante, Nvidia intègre un GPU digne de ce nom. Exit le GeForce ULP et place à Kepler pour le futur Tegra K1 !

Le Tegra K1 v1

Il a souvent été fait référence au nouveau SoC de Nvidia, nom de code Logan, en tant que Tegra 5, succession logique au Tegra 4. Nvidia a cependant décidé que la rupture d'architecture qui l'accompagne devait se refléter dans le nom du produit qui sera ainsi officiellement...

[+] Lire la suite

CES: Nvidia annonce Tegra K1, avec Denver en option

Publié le 06/01/2014 à 07:48 par Damien Triolet

A chaque CES son nouveau Tegra. L'édition 2014 du salon ne déroge pas à la règle et Nvidia y annonce officiellement son nouveau SoC précédemment connu sous le nom de code Logan. Destiné aux tablettes, aux gros smartphones et autres consoles mobiles, le Tegra K1 se démarque des précédents Tegra par l'arrivée, enfin d'un GPU Kepler, à l'architecture identique à celle des GeForce GTX 600 et GTX 700.


Nous vous avons déjà parlé de Logan à plusieurs reprises, Nvidia ayant dévoilé ses caractéristiques principales en mars lors de sa conférence GTC et cet été lors du Siggraph :

4+1 cores Cortex-A15 32-bit
GPU Kepler 192 "cores" (1 SMX)
Interface mémoire 64-bit

Grossièrement Tegra K1 est donc un SoC Tegra 4 dont le GPU de classe DirectX 9 à l'architecture vieillissante a été remplacé par un GPU Kepler de classe DirectX 11 qui correspond à une demi GeForce GT 740M. Une évolution attendue depuis longtemps qui permet à Nvidia, enfin de proposer pour son SoC une composante graphique à la hauteur de sa réputation sur PC.


Nvidia parle de 365 Gflops soit une puissance de calcul au niveau des pixels supérieure à celle des consoles PS3 et Xbox 360. De quoi afficher des performances qui seraient plus que doublées par rapport à celle du SoC Apple A7.

En dehors du nom commercial du SoC, l'autre grosse annonce concerne l'arrivée d'une seconde version de Tegra K1… équipée avec 2 cores Denver. Pour rappel il s'agit du premier core ARMv8 64-bit développé en interne par Nvidia, qui promet pour celui-ci des performances de premier plan tant en single thread qu'en multi thread.


Les premiers prototypes de cette version de Tegra K1 viennent tout juste de sortir des usines de TSMC et étaient déjà fonctionnel, ce que nous avons pu observer lors d'une démonstration très limitée qui n'incluait malheureusement aucun aperçu de ses performances. Il est encore trop tôt pour cela et Nvidia est probablement très optimiste en parlant de l'arrivée de premiers produits au second semestre. Nous tablons plutôt sur fin 2014 pour que ce Tegra K1 v2 débarque dans le commerce.


Nvidia en a profité pour dévoiler les grandes lignes de ses spécifications. Contrairement au Cortex-A15 qui est de type superscalaire 3 voies, Denver passe à 7 voies. Une architecture beaucoup plus large qui s'annonce effectivement bien plus performante en single thread. Pour le reste, Nvidia parle de fréquences jusqu'à 2.5 GHz, de caches L1D et L1I qui passent à 128 Ko et 64 Ko ainsi que d'un GPU Kepler identique à celui de Tegra K1 v1. Les deux versions de Tegra K1 seront compatibles pin-to-pin, ce qui permettra aux fabricants de passer assez facilement de l'un à l'autre, et ce qui indique que l'interface mémoire reste identique à 64-bit (double canal 32-bit).

Top articles