Les contenus liés au tag Pascal

Afficher sous forme de : Titre | Flux Filtrer avec un second tag : GDDR5X; GeForce; GeForce 10; GP100; GP104; GP106; GTC; GTC16; GTX 1060; Nvidia;

Tile rendering pour Maxwell et Pascal ?

Tags : Maxwell; Nvidia; Pascal;
Publié le 01/08/2016 à 16:03 par Damien Triolet

David Kanter de real world technologies  nous a indiqué ce matin avoir publié une analyse intéressante concernant les GPU Maxwell et Pascal de Nvidia. Un test ciblé a permis de mettre en évidence une progression de la rastérisation de plusieurs triangles par blocs plus ou moins petits de l'image (appelés tiles) en opposition à un rendu classique pour les GPU de bureau qui consiste à traiter le rendu d'un triangle sur toute l'image avant de passer au suivant.

De quoi pouvoir faire un rapprochement avec le tile based rendered ou le tiled based deffered renderer des GPU mobiles Adreno, Mali ou PowerVR ? Il y a trop peu d'informations pour y répondre avec certitude, mais en l'état actuel des choses notre interprétation diverge quelque peu de celle de notre confrère. Nous pensons donc que ce n'est pas le cas, une telle approche généralisée aurait d'ailleurs peu de sens, ces types de rendu ayant tendance à être contreproductifs avec l'augmentation de la complexité géométrique, ce qui est justement un point fort des GPU Nvidia.

Tous les GPU fonctionnent à un niveau ou à un autre sur des tiles, ne serait-ce que pour harmoniser les accès mémoire et pouvoir mettre en place des techniques de compression. Le terme tiles est cependant souvent source de confusion puisqu'il peut ne pas avoir de lien avec ce qui est généralement compris quand on parle de tiled based rendering, à savoir un rendu en deux passes avec un tri de la géométrie après transformation pour lier chaque primitive à une ou plusieurs tiles. De quoi pouvoir effectuer le rendu sur de petits blocs qui resteront en cache durant toutes les opérations pour n'être écrits en mémoire qu'une seule fois en toute fin. Pour en savoir plus sur les différents modes de rendu, nous vous invitons à consulter cette actualité : GDC: Architecture GPU : IMR, TBR ou TBDR ?

Alors que se passe-t-il avec les GPU Maxwell et Pascal ? Nous pensons que ce qu'a mis en lumière David Kanter est plutôt une optimisation opportuniste par exemple pour le traitement des gros triangles, et peut-être d'autres cas, et non un rendu à base de tiles comme on l'entend en général et qui implique un tri des primitives au préalable. Tous les GPU Nvidia depuis Fermi doivent d'ailleurs travailler sur des tiles avec les gros triangles puisqu'ils doivent être segmentés pour être traités par plusieurs GPC et donc par plusieurs moteurs de rastérisation. Progressivement Nvidia en a probablement profité pour apporter quelques optimisations.

Nous supposons qu'avec de gros triangles, dont la couverture représente une partie importante de l'image, les GPU Nvidia récents font en sorte d'éviter de devoir écrire d'emblée en mémoire une quantité énorme de pixels dont une partie pourrait s'avérer par la suite être masquée et donc inutile, ce qui représenterait un gaspillage de bande passante et d'énergie. Etant donné que ces gros triangles sont en principe peu nombreux, il est relativement aisé d'en garder les données en cache ou dans une mémoire spécifique, pour les traiter par morceaux à un moment plus opportun.

Si notre supposition est correcte, cette approche peut sembler similaire à ce que l'on entend en général par tiled based rendering, mais uniquement dans des cas très particuliers, le mode de traitement de la géométrie restant fondamentalement différent. Ce type d'approche fait partie d'un ensemble de techniques qui ont permis à Nvidia d'augmenter le rendement de ses GPU, tant sur le plan énergétique que sur celui des performances en exploitant la bande passante disponible à meilleur escient.

Nouvelle Nvidia Titan X: GP102, 11 Tflops, 480 Go/s

Publié le 22/07/2016 à 05:19 par Damien Triolet

Cela n'aura donc pas tardé. Alors que la GeForce GTX 1080 domine déjà largement son sujet, Nvidia va enfoncer le clou début août avec une nouvelle Titan X ultra haut de gamme 30% plus performante pour 1300€.

Tout comme cela a été le cas sur la génération Maxwell, Nvidia a développé au moins 3 GPU Pascal destinés aux GeForce en suivant à peu près des proportions de type 1, 2 et 3. Nous avons déjà pu apercevoir le numéro 2 avec le GP104 de la GeForce GTX 1080, et récemment le numéro 1 avec le GP106 de la GeForce GTX 1060. C'est le numéro 3 que Nvidia dévoile aujourd'hui, le GP102, qui va prendre place dans la nouvelle Titan X 12 Go qui arbore un design similaire à celui des GTX 1080/1070, mais en noir.

Le GP102 peut être vu comme une version "GeForce" du GP100 spécifique aux accélérateurs Tesla. Ce nouveau gros GPU Pascal, fabriqué en 16nm et qui embarque pas moins de 12 milliards de transistors, se contente de GDDR5X, ne supporte pas la double précision rapide, ni les liens NVLink. De quoi réduire sa taille de 610 à 471 mm². Tout comme le GM200 (GTX Titan X originale) par rapport au GM204 (GTX 980), le GP102 augmente tout de 50% par rapport au GP104. Le nombre de GPC passe de 4 à 6, les SM de 20 à 30, les unités de calcul de 2560 à 3840 et le bus mémoire de 256-bit à 384-bit.

La nouvelle Titan X version Pascal n'en exploite cependant pas une version complète, 2 SM sont désactivés pour faciliter la production. Elle se contente donc de 3584 unités de calcul actives. Voici ses spécifications telles que dévoilées aujourd'hui par Nvidia :

Un nouveau record au niveau de la puissance de calcul est atteint avec 11 Tflops, c'est 23% de mieux que pour la GeForce GTX 1080 alors que la bande passante augmente de 50%. De quoi laisser espérer une progression des performances de 30% qui va creuser encore un peu plus le fossé qui sépare actuellement les GeForce des Radeon.

Nous pouvons observer que cette nouvelle Titan X se contente d'une fréquence GPU inférieure à celle de la GTX 1080 avec une fréquence GPU Boost officielle de 1.53 GHz. Il est probable que le GP102 soit capable d'atteindre des fréquences similaires à celles du GP104 mais que l'enveloppe thermique de la Titan X le limite quelque peu. Si la limite de consommation est relativement large avec 250W, c'est plutôt la capacité de refroidissement du ventirad qui définira la fréquence soutenue en pratique.

Sans en dire plus, Nvidia annonce une puissance de 44 Tops INT8 avec de nouvelles instructions dédiées à l'inférence du deep learning. Nous présumons que ces nouvelles instructions sont exclusives au GP102 et consistent à rassembler 4 données INT8 dans un registre 32-bit avec une prise en charge native au niveau des unités de calcul, à la manière du support du FP16 sur le GP100 (ou du MMX pour les nostalgiques). Si cela se confirme, cela devrait faire de cette Titan X Pascal un accélérateur particulièrement performant dans ce domaine.

La nouvelle Titan X sera commercialisée directement par Nvidia à partir du 2 août pour un tarif de 1200$ qui devrait se traduire par 1300€ en Europe. Une tarification élevée mais qui est plutôt logique par rapport au reste de la gamme et au côté exclusif ou semi-pro de cette carte graphique. Vous aurez d'ailleurs pu remarquer que pour renforcer cet aspect, Nvidia la positionne non pas dans, mais bien à côté de la gamme GeForce GTX dont elle ne reprend pas la marque.

On ne peut qu'espérer qu'à terme le GP102 soit décliné sur une GeForce GTX (1080 Ti ?), avec un peu de concurrence de la part d'AMD et de son GPU Vega pour la rendre plus abordable.

Pour terminer voici tout d'abord une petite vidéo d'introduction de ce nouveau monstre :

Et ensuite la vidéo de l'évènement dédié au deep learning au cours duquel Jen Hsun Huang est intervenu pour dévoiler la Titan X (à partir de 11'30) :

Dossier : GeForce GTX 1070 8 Go et GTX 1060 6 Go : les cartes d'Asus et Gainward en test face aux Founders Edition de Nvidia

Publié le 19/07/2016 à 15:00 par Damien Triolet

Petit à petit, Nvidia renforce sa gamme de GeForce GTX 10. Avec la GTX 1070 et ensuite avec la GTX 1060 6 Go destinée à barrer la route de la Radeon RX 480. De bonnes solutions pour les joueurs ?

[+] Lire la suite

Nvidia annonce la GeForce GTX 1060 6 Go (maj)

Publié le 07/07/2016 à 15:00 par Damien Triolet

Après les GeForce GTX 1080 et GTX 1070, Nvidia enchaîne avec l'arrivée d'une nouvelle déclinaison dérivée de l'architecture Pascal. La GeForce GTX 1060 promet des performances du niveau de la GTX 980 pour une consommation de seulement 120W.

Nous n'attendions pas la GeForce GTX 1060 aussi tôt mais Nvidia a probablement mis les bouchées doubles pour accélérer sa sortie et ne pas laisser trop d'espace à la Radeon RX 480, même si cette dernière s'affiche au final un cran sous la GTX 980 que Nvidia vise avec la nouvelle venue. La Radeon RX 480 de référence est en effet plutôt au niveau de la GTX 970 mais devrait également rester moins chère.

Comme pour les autres GeForce 10, Nvidia va en proposer une version Founders Edition, qui correspond à un design de référence haut de gamme :

 
 

Vu le segment inférieur visé, le design de la GTX 1060 Founders Edition, qui embarque 6 Go, a cependant été quelque peu simplifié. La carte est plus courte, 25cm contre 27cm, et la fenêtre en plexiglass disparaît (le radiateur est donc fermé sur le dessus des ailettes). Pour le reste les matériaux sont similaires et de très bonne facture. Le logo GeForce illuminé en vert reste de la partie. Lors de la prise en main, la GTX 1060 Founders Edition est nettement plus lourde qu'une RX 480 par exemple, et proche du poids d'une GTX 1070, ce qui, associé au TDP de 120W, donne confiance et laisse penser que les nuisances devraient être plutôt bien contenue pour une carte à turbine.

Comme vous pouvez le voir, le PCB est plus court que le système de refroidissement. Le prolongement qui fait office de support pour la turbine fait cependant partie de la plaque d'aluminium qui recouvre l'ensemble du PCB. Il ne s'agit donc pas d'une petite rallonge en plastic comme sur une GTX 670 par exemple. Petit raffinement supplémentaire, Nvidia a déplacé le connecteur d'alimentation du PCB vers l'arrière de la carte, ce qui facilite un câblage propre.

Autre petit détail à observer, la GTX 1060 est dépourvue de connecteur SLI. Cela ne veut pas dire que Nvidia suit la voie d'AMD en proposant du multi-GPU sans connecteur mais bien que la société a décidé de limiter son utilisation sur le très haut de gamme. Certes certains utilisateurs seront déçus de ne pas pouvoir essayer d'obtenir des performances proches de celles d'une GTX 1080 avec une paire de cartes qui revient moins cher, mais cela nous semble au final assez logique puisque cela va dans le sens de nos propres conseils depuis plusieurs années : privilégier les plus gros GPU avant de penser au multi-GPU.

Que se cache derrière cette GTX 1060 ? Pour ce premier dérivé Pascal milieu de gamme, Nvidia exploite un autre GPU que pour ses grandes soeurs : le GP106. Grossièrement il s'agit d'un demi GP104 mais avec un bus qui reste proportionnellement un peu plus large avec 192-bit :

  • GP104 : 4 GPC, 20 SM, 2560 FP32, 64 ROP, bus 256-bit, 2048 Ko de L2
  • GP106 : 2 GPC, 10 SM, 1280 FP32, 48 ROP ?, bus 192-bit, 1536 Ko de L2 ?
  • GM204 : 4 GPC, 16 SM, 2048 FP32, 64 ROP, bus 256-bit, 2048 Ko de L2

A noter que toutes les informations n'ont pas encore été communiquées par Nvidia concernant l'interface mémoire et nos essais à ce niveau restent pour l'instant sous embargo. Nous nous contenterons d'indiquer que selon notre première impression il n'y aurait pas d'entourloupe similaire au sous-système mémoire de la GeForce GTX 970, qui a été annoncée avec un bus 256-bit mais qui est plutôt en interne une carte 224-bit avec 3.5 Go de mémoire rapide et 512 Mo supplémentaire plus lente.

Nvidia utilisant en général les mêmes blocs de base pour les différents GPU d'une même architecture, nous pouvons supposer qu'avec un bus 192-bit, le GP106 et la GTX 1060 disposent de 48 ROP. Le débit de pixels sera cependant limité en amont à 32 pixels par cycle (par les 2 GPC) et les ROP supplémentaires ne seront utiles que pour améliorer quelque peu le rendement avec antialiasing ou certains formats qu'ils traitent plus lentement.

Voici maintenant les spécifications complètes de la carte, avec uniquement une petite inconnue au niveau de ses ROP, le temps que Nvidia confirme officiellement qu'il s'agit bien de 48 :

La GeForce GTX 1060 affiche des spécifications inférieures à celles de la GTX 980 au niveau des débits bruts. Nvidia estime cependant que la première sera capable d'égaler la seconde, avec le gain de fréquence, qui aide par exemple quand le processeur de commandes est la limite, et les petites améliorations apportées à l'architecture.

Nous vérifierons cela lors du test qui sera publié à sa sortie, prévue pour la 19 juillet. La GTX 1060 Founders Edition sera alors proposée à 299$ (+/- 350€) mais elle ne devrait cette fois être commercialisée que par Nvidia qui parle d'ailleurs de Special Limited Founders Edition.

Les partenaires devraient tous proposer des designs personnalisés dès le lancement avec un tarif débutant à 249$ soit 290€. A voir ce qu'il en sera en pratique, la faible disponibilité du GP104 ayant par exemple poussé les partenaires de Nvidia à se concentrer en priorité sur des designs plus chers que le tarif annoncé.

A noter que Nvidia ne parle actuellement que d'une GeForce GTX 1060 6 Go. Il n'est pas impossible qu'une version 3 Go soit proposée par la suite, le problème étant, comme pour la Radeon RX 480, la disponibilité de puces GDDR5 8 Gbps de densité inférieure. Il est probable que Nvidia peaufine le positionnement d'une probable GeForce GTX 1050 avant de décider de proposer ou pas une version 3 Go de la GTX 1060.

Mise à jour du 08/07 :

Nvidia vient de communiquer les tarifs officiels en Europe et ils sont inhabituellement agressifs par rapports aux tarifs en dollars : 320€ pour la GTX 1060 Founders Edition et 280€ en premier prix pour les cartes partenaires.

Nvidia semble avoir réduit sa marge sur la Founders Edition pour le marché européen, une manoeuvre plus simple à contrôler puisque cette carte devrait être distribuée exclusivement via son site. A voir bien entendu si ces tarifs se retrouveront réellement au lancement, mais il semble évident que Nvidia a décidé de faire tout pour ne pas laisser d'espace à AMD et ses partenaires.

GTX 1070: 3 GPC, juste devant la GTX 980 Ti

Publié le 30/05/2016 à 00:00 par Damien Triolet

C'est aujourd'hui que prend fin l'embargo sur les tests de la GeForce GTX 1070, mais nous ne pourrons malheureusement pas vous en proposer le test complet habituel avant notre retour du Computex. Les premiers tests de nos confrères mettent en avant des performances légèrement supérieures à celles de la GTX 980 Ti et évidemment un bond important par rapport à la GeForce GTX 970.

 
 

Si nous n'avons pas encore pu faire tourner la carte de référence, baptisée GeForce GTX 1070 Founders Edition, nous avons pu apprendre quelques petits détails de plus au niveau des différences par rapport à la GeForce GTX 1080 Founders Edition. Si les designs sont proches, la GTX 1070 se contente de 4 phases pour le GPU et de 3 petits caloducs dans la base du ventirad contre 5 phases et une chambre à vapeur pour sa grande soeur.

Par ailleurs, Nvidia nous a indiqué que toutes les GTX 1070 seraient limitées à 3 GPC. Comme nous l'expliquions auparavant, plusieurs configurations étaient possibles. Cela implique que la GTX 1070 a un débit maximal de 3 triangles rendus par cycle (contre 4 sur la GTX 1080), et que son fillrate est limité à 48 pixels par cycle. Même si l'interface mémoire est complète avec 64 ROP, chaque GPC ne peut débiter que 16 pixels par cycle. Voici dans le tableau de spécifications final :

La disponibilité de la GeForce GTX 1070 est toujours annoncée pour le 10 juin pour la Founders Edition. Les modèles personnalisés devraient ensuite arriver rapidement, d'autant plus qu'ils seront probablement basés sur le même design que les GTX 1080 personnalisées.

Top articles