Nvidia annonce le SoC Xavier avec GPU Volta

Tags : Nvidia; Tegra; Volta; Xavier;
Publié le 28/09/2016 à 15:36 par
Imprimer

Depuis un peu plus de deux ans, Nvidia s'était abstenu de présenter une roadmap pour ses SoC. Il faut dire que ses plans à ce niveau ont changé à plusieurs reprises, notamment avec l'abandon du marché du smartphone, trop concurrentiel, trop coûteux au niveau de la certification pour les différents réseaux et dans lequel il était difficile de réellement se démarquer en respectant une enveloppe thermique très stricte.

Progressivement, Nvidia a repositionné ses SoC Tegra sur d'autres marchés pour lesquels son expertise peut plus facilement apporter une plus-value. C'est le cas pour la conduite autonome ou pour tout ce qui concerne l'AI et plus précisément l'inférence, soit l'exploitation d'un réseau de neurones artificiels (deep learning). Pour ce type d'utilisation d'un SoC, il est aujourd'hui crucial d'apporter un maximum de performances dans une enveloppe thermique raisonnable mais pas aussi stricte que dans le monde mobile. Par ailleurs, ses gros GPU se sont retrouvés, un peu par hasard au départ, au coeur de l'évolution du deep learning. Une expérience qui a permis à Nvidia de construire un écosystème logiciel efficace et d'apporter de petites touches à ses architectures CPU et GPU qui peuvent avoir un impact crucial sur les performances. Alors que la concurrence s'annonce extrêmement rude pour le deep learning voué à se répandre dans de nombreux secteurs, que ce soit au niveau de l'entraînement des réseaux que de l'inférence, Nvidia conserve donc une bonne carte à jouer à condition de soutenir une cadence élevée dans ses développements.

Il y a tout juste un mois, Nvidia dévoilait ainsi quelques détails sur son SoC Parker fabriqué en 16nm. Celui-ci va succéder d'ici quelques temps aux SoC Logan (Tegra K1) et Erista (Tegra X1) avec une claire orientation pour le marché automobile. Il est pour rappel équipé d'une partie CPU composée de 2 coeurs maison Denver 2 et de 4 coeurs Cortex-A57 associés à un GPU Pascal de 256 unités de calcul (2 SM), le tout étant interfacé en 128-bit LPDDR4.

Pour le marché automobile, il supporte notamment des instructions spécifiques au deep learning (pour booster certaines opérations en INT8 / FP16), la mémoire ECC, la virtualisation hardware, 12 caméras et une connectique adaptée. La première utilisation de Parker se fera dans la plateforme Drive PX 2 dérivée en deux versions. L'une se contente d'un seul SoC Parker et est dédiée aux aides à la conduite simples, l'autre associe 2 SoC Parker et 2 GPU GP106 pour une conduite semi-autonome alors que Nvidia parle d'associer plusieurs de ces plateformes pour une conduite totalement autonome. De quoi démontrer au passage le besoin de plateformes plus performantes encore.

C'est là qu'intervient le successeur de Parker dont le nom de code est Xavier, en référence au super-héros. Dévoilé à l'occasion de la première édition de la GTC Europe qui se tient actuellement à Amsterdam, Xavier sera basé sur 8 coeurs ARM custom (Denver 3 ?) et un GPU Volta de 512 unités de calcul avec un moteur vidéo capable de travailler en 8K. Toujours fabriqué en 16nm, il embarquera pas moins de 7 milliards de transistors, ce qui est énorme pour un SoC. Nvidia vise une puissance de calcul de pas moins de 20 téraops en deep learning pour une enveloppe thermique de 20W.

De quoi potentiellement remplacer une plateforme Drive PX 2 complète par un simple SoC (ce que Nvidia illustre par la version simple de Drive PX 2 pour l'aide à la conduite, il n'y a actuellement aucune vraie photo de Xavier ou de la plateforme qui l'accueille). Reste bien entendu qu'il y a une astuce et que cette valeur de 20 téraops est un maximum obtenu sur des instructions spécifiques. Avec 512 unités de calcul cadencées par exemple à 2 GHz, Xavier affichera une puissance de +/- 2 téraflops en FP32 (contre 8 téraflops pour Drive PX 2). Se contenter des instructions INT8 de Pascal ne permettrait de monter qu'à 8 téraops en deep learning (contre 24 téraops pour Drive PX 2).

En annonçant 20 téraops, Nvidia dévoile donc que l'architecture GPU Volta apportera de nouvelles évolutions qui donneront un coup de boost significatif à certains algorithmes liés au deep learning et de toute évidence à l'inférence. Précision de calcul inférieure à 8-bit ? De nouvelles instructions spécifiques équivalentes à plus d'ops ? Il faudra encore patienter quelques temps avant d'en savoir plus. Nvidia prévoit un premier échantillonnage de Xavier fin 2017 pour une disponibilité commerciale en 2018. D'ici-là les premiers GPU Volta devraient avoir été lancés.

Vos réactions

Top articles