Les derniers contenus liés aux tags Pascal et GP104

Nvidia lance les Quadro Pascal dont une GP100

Publié le 09/02/2017 à 10:57 par Damien Triolet

Après deux premiers modèles lancés cet été, Nvidia vient de dévoiler toute une famille de Quadro de génération Pascal qui vont pousser vers le haut puissance de calcul et efficacité énergétique. Un lancement qui permet par ailleurs à Nvidia d'introduire le GPU GP100 et sa mémoire HBM2 sur une carte graphique.

Cet été, Nvidia avait débuté le renouvellement de sa gamme de cartes graphiques professionnelles avec l'introduction de deux nouvelles Quadro, les P6000 et P5000 respectivement basées sur les GPU Pascal GP102 (Titan X) et GP104 (GTX 1080). D'autres modèles étaient bien entendu au programme et viennent d'être dévoilés : les Quadro GP100, P4000, P2000, P1000, P600 et P400. En voici les spécifications :

La Quadro GP100 est bien entendu la nouvelle venue la plus intéressante, mais avant d'en parler en plus de détails, intéressons-nous aux autres modèles de la famille que Nvidia positionne de la sorte :

 
 

La Quadro P6000, dont nous avions omis de parler à sa sortie, est basée sur un GPU GP102 complet et équipée de 24 Go de GDDR5X, contrairement à la Titan X qui embarquait le même GPU mais castré et avec "seulement" 12 Go de mémoire. La Quadro P6000 représente l'offre de Nvidia la plus élevée en terme de puissance de calcul en simple précision et de quantité de mémoire embarquée. Elle affiche une puissance brute 70% plus élevée que celle de la M6000 24 Go qu'elle remplace. Elle vise donc les applications de rendu les plus lourdes ou encore le GPGPU.

En-dessous, la Quadro P5000 vise des applications similaires mais est un peu moins véloce. Il s'agit d'une version professionnelle de la GeForce GTX 1080 mais équipée de 16 Go de mémoire GDDR5X. La puissance brute a cette fois été doublée par rapport à la M5000.

Les nouvelles Quadro P4000, P2000, P1000, P600 et P400 remplacent les M4000, M2000, K1200, K620 et K420, ces dernières n'ayant pas profité du passage à l'architecture Maxwell. Excepté pour la P2000 qui passe à 5 Go au lieu de 4 Go, la quantité de mémoire n'évolue pas, Nvidia faisant en sorte de forcer une forte segmentation sur ce point.

La P4000 repose sur un GPU GP104 fortement castré qui permet à Nvidia de limiter sa consommation à 105W et de proposer un format simple slot. Sa puissance de calcul est doublée par rapport la M4000.

La P2000 embarque de son côté un GPU GP106, comme sur la GeForce GTX 1060, mais castré tant au niveau des unités actives que du bus mémoire, raison pour laquelle elle embarque un ensemble inhabituel de 5 Go de mémoire. Sa puissance de calcul profite d'un boost de 65% par rapport à la M2000.

Dans l'entrée de gamme, les P1000, P600 et P400 sont toutes trois basées sur le GPU GP107 (GTX 1050) plus ou moins castré. Leur puissance de calcul est donc plutôt limitée même si elle est doublée par rapport à la génération précédente. Ce type de Quadro est plutôt utile pour profiter des pilotes professionnels dans certaines applications que pour leur puissance de calcul.

De quoi en arriver à la Quadro GP100 qui nous intéresse particulièrement. Sa nomenclature l'indique sans ambiguïté, il s'agit d'une carte à part, qui vise autant les applications traditionnelles des Quadro et que le GPU Computing qui a besoin de plus que la simple précision. Pour rappel, le GPU GP100 qui lui donne son nom est le premier à embarquer la mémoire HBM2, pour une bande passante plus élevée, ainsi qu'une interconnexion de nouvelle génération : NVLink.

Jusqu'ici, le GP100 n'était exploité qu'en format serveur, soit de type PCI Express passif, soit de type module mezzanine. Nous pouvions donc nous demander si Nvidia avait réellement équipé ce GPU de tout l'attirail nécessaire pour en faire une carte graphique, notamment le moteur d'affichage et les sorties vidéo, puisqu'il est avant tout destiné au calcul massivement parallèle. Une interrogation qui trouve donc une réponse avec son arrivée dans une Quadro au format carte graphique classique.

Au niveau de la puissance brute en simple précision (FP32), cette Quadro GP100 n'est pas impressionnante. Sur ce point, le GP100 n'est pas mieux armé que le GP102 et Nvidia a décidé de castrer le GP100 de la Quadro GP100 alors que le GP102 de la Quadro P6000 est complet. Cette dernière est ainsi 15% plus véloce à peu près à tous les niveaux liés au rendu 3D. Le GP100 est probablement équipé de 128 ROP contre 96 pour le GP102, mais ses 6 moteurs de rastérisation ne peuvent en débiter plus de 96. Par ailleurs, il faut se contenter de seulement 16 Go de mémoire contre 24 Go pour la P6000.

Pour de nombreuses applications le choix entre ces deux Quadro sera pour le moins délicat. Là où le GP100 se démarque c'est avec un support très performant de la double précision (FP64) et de la demi-précision (FP16), et bien entendu au niveau de la bande passante mémoire largement supérieure avec 717 Go/s. Autre avantage, mais dont il est difficile d'estimer l'intérêt en pratique, la Quadro GP100 voit ses connecteurs SLI remplacés par 2 liens NVLink. Ceux-ci vont permettre de coupler 2 Quadro GP100 en donnant à chaque GPU un accès plus performant à la mémoire de l'autre.

En équipant sa nouvelle Quadro de cette connectique, Nvidia en fait notamment une solution de développement très utile pour la plateforme Tesla puisqu'il est possible de l'utiliser pour faire du développement sur station de travail en vue d'en déploiement sur serveur par la suite.

La Quadro GP100 se retrouvera dans quelques mois en face de la Radeon Instinct MI25 qui devrait profiter d'une puissance de calcul légèrement supérieure mais d'une bande passante inférieure. Comme pour le reste des nouvelles Quadro, la disponibilité de la Quadro GP100 est prévue pour mars, à un tarif qui n'a pas encore été communiqué.

Terminons par un petit mot sur ce que cela implique du côté des cartes graphiques destinées au moins en partie aux joueurs. La Quadro GP100 laisse penser que le GP100 pourrait également se retrouver dans une nouvelle Titan. De quoi pouvoir envisager le remplacement de la Titan X 12 Go actuelle par une version GP100 16 Go en même temps que le lancement d'une éventuelle GeForce GTX 1080 Ti en GP102 ?

Les GTX 1080/1070/1060 passent au mobile

Publié le 16/08/2016 à 06:00 par Damien Triolet

Après une série de lancements à succès pour ses GPU Pascal, Nvidia décline les GeForce GTX 1080, 1070 et 1060 en versions mobiles, similaires à leurs équivalents desktops. Une nette progression par rapport à la génération précédente qui devrait reconduire sa domination presque totale sur le marché des portables gaming.

Il y a un peu moins d'un an, Nvidia a expérimenté une stratégie différente dans le monde mobile avec le lancement d'une GeForce GTX 980 similaire à ce qui se fait dans le monde des cartes graphiques desktops mais au format mobile. L'essai a de toute évidence été validé et c'est cette fois l'ensemble du haut de gamme mobile qui est calqué sur les cartes graphiques desktops.

Traditionnellement, les portables devaient se contenter de versions "M", nettement moins véloces. Par exemple, Nvidia profitait de l'aura de la GTX 980 desktop pour commercialiser une GTX 980M nettement inférieure à une GTX 970 desktop. Une course aux gros chiffres qui plait aux fabricants de portables mais qui entraine de la confusion et peut tromper certains acheteurs.

La donne est cependant en train de changer. La nette domination de Nvidia lui permet de créer des marques fortes autour de ses déclinaisons principales, l'efficacité de ses GPU a explosé et les fabricants de portables gamings sont moins réticents face aux cartes graphiques gourmandes. Il est donc plus simple de proposer des références communes aux deux mondes, ce qui est une très bonne chose. Pour son nouveau haut de gamme mobile, Nvidia a ainsi décidé de proposer des solutions similaires aux GeForce GTX 1080, GTX 1070 et GTX 1060 desktops, en conservant le même nom et le même potentiel de performances :

Les différences au niveau des spécifications sont légères. Les GTX 1080 et 1060 mobiles et desktop sont identiques au niveau de la configuration et la première va jusqu'à afficher une même fréquence turbo. Il y a par contre quelques différences pour la GTX 1070 qui en version mobile profite de quelques unités de calcul de plus pour compenser sa fréquence légèrement inférieure.

Un point commun dans les spécifications de ces déclinaisons mobiles concerne la fréquence de base qui est réduite, de toute évidence pour s'adapter à des contraintes thermiques plus importantes. Car au final ce sont les limites de consommation et de température (modulée par la courbe de ventilation), qui définiront les performances.

Et c'est d'ailleurs encore et toujours le point sur lequel Nvidia refuse de communiquer et se contente d'indiquer qu'il y a des spécifications minimales à respecter. Quelles sont-elles exactement ? Nous ne le saurons pas. Lors de la présentation de ces cartes graphiques, le baratin bon marché ne semblant pas suffire à convaincre l'assemblée, Nvidia a fini par indiquer que la GTX 1080 mobile reprend l'enveloppe thermique de la GTX 980 mobile, la GTX 1070 mobile celle de la GTX 980M et la GTX 1060 mobile celle de la GTX 970M. De quoi permettre une transition rapide vers ces nouveaux modèles sur base des designs déjà existants.

Nous pouvons ainsi supposer que le GTX 1080 en version mobile profitera d'un TDP plutôt énorme configurable entre 120 et 180W, suivant la capacité de refroidissement des portables. Cela impactera évidement ses performances pratiques mais dans un très gros portable il sera possible d'obtenir des performances du même ordre qu'une GTX 1080 Founders Edition. La GTX 1070 mobile se contentera probablement de +/-100W alors qu'il devrait s'agir de 80W pour la GTX 1060 mobile.

Nvidia estime que les performances atteindront en moyenne au moins 90% des équivalents desktops, de quoi afficher des gains de +/- 70% par rapport à la génération précédente ! Des gains importants qui correspondent à la progression du rendement énergétique entre les générations de GPU Maxwell et Pascal.

 
 

Des machines seront proposées sous peu par Acer, Alienware, Asus, Clevo, EVGA, Gigabyte, HP, Lenovo, MSI, Origin, Razer, Sager et XMG. Pour cette génération, Nvidia s'attend à ce que l'utilisation d'un écran G-Sync soit plus fréquente et précise qu'il y aura cette fois des versions 1440p et 120 Hz.

Ces GTX 1000 mobiles restent cependant compatibles avec Optimus, soit l'association avec un iGPU Intel pour les fabricants qui préfèrent cette approche. Il y a toujours des gains possibles en terme d'autonomie au repos, mais cela empêche l'utilisation de G-Sync. Dans tous les cas, Nvidia précise avoir travaillé avec ses partenaires pour faire en sorte que toutes les sorties soient connectées au GPU GeForce. Même dans le cas d'une solution Optimus, la compatibilité avec les casques de réalité virtuelle devrait donc être assurée.

Au niveau logiciel, Nvidia explique avoir amélioré BatteryBoost, son système de réduction de la consommation en mode batterie qui autoriserait un gain de 30% par rapport à la génération précédente, probablement en agissant plus agressivement sur les fréquences. Par ailleurs, ce mode profite d'un nouveau système de lissage de la cadence d'affichage, similaire ce qui se fait en multi-GPU, pour maintenir une fluidité et un confort de jeu supérieur.

L'overclocking reste évidemment de la partie et est identique à ce qui se fait sur desktop à l'exception de la possibilité de survoltage qui ne sera pas proposée. La marge au niveau de la fréquence sera similaire et atteindre 2 GHz sera à la portée de nombreuses machines, même si en pratique les limites thermiques la stabiliseront bien entendu à un niveau plus faible. Il sera possible pour les fabricants de proposer des overclockings d'usine, mais les premières machines devraient se contenter des fréquences de référence.

De toute évidence, avec ces GeForce GTX 1080, GTX 1070 et GTX 1060 en versions mobiles, Nvidia dispose d'une offre solide pour les machines haut de gamme destinées aux joueurs exigeants, un segment qui se porte d'ailleurs plutôt très bien au milieu d'un marché PC qui souffre globalement. Et malheureusement pour les tarifs, ces solutions de Nvidia devraient rester à peu près sans concurrence.

Le GPU Polaris 10 d'AMD (Radeon RX 480) est trop en retrait au niveau de l'efficacité énergétique pour être compétitif. Pour rappel, il est un peu moins performant qu'une GTX 1060 pour une consommation de l'ordre d'une GTX 1080. C'est plutôt sur l'entrée de gamme voire le milieu de gamme qu'AMD conserve une carte à jouer avec le petit Polaris 11. A ce niveau, Nvidia n'a pas encore dévoilé son jeu et nous ne savons pas si un autre petit GPU Pascal sera rapidement proposé ou s'il s'agira de renommages de la gamme précédente.

 
 

Dossier : GeForce GTX 1070 8 Go et GTX 1060 6 Go : les cartes d'Asus et Gainward en test face aux Founders Edition de Nvidia

Publié le 19/07/2016 à 15:00 par Damien Triolet

Petit à petit, Nvidia renforce sa gamme de GeForce GTX 10. Avec la GTX 1070 et ensuite avec la GTX 1060 6 Go destinée à barrer la route de la Radeon RX 480. De bonnes solutions pour les joueurs ?

[+] Lire la suite

GTX 1070: 3 GPC, juste devant la GTX 980 Ti

Publié le 30/05/2016 à 00:00 par Damien Triolet

C'est aujourd'hui que prend fin l'embargo sur les tests de la GeForce GTX 1070, mais nous ne pourrons malheureusement pas vous en proposer le test complet habituel avant notre retour du Computex. Les premiers tests de nos confrères mettent en avant des performances légèrement supérieures à celles de la GTX 980 Ti et évidemment un bond important par rapport à la GeForce GTX 970.

 
 

Si nous n'avons pas encore pu faire tourner la carte de référence, baptisée GeForce GTX 1070 Founders Edition, nous avons pu apprendre quelques petits détails de plus au niveau des différences par rapport à la GeForce GTX 1080 Founders Edition. Si les designs sont proches, la GTX 1070 se contente de 4 phases pour le GPU et de 3 petits caloducs dans la base du ventirad contre 5 phases et une chambre à vapeur pour sa grande soeur.

Par ailleurs, Nvidia nous a indiqué que toutes les GTX 1070 seraient limitées à 3 GPC. Comme nous l'expliquions auparavant, plusieurs configurations étaient possibles. Cela implique que la GTX 1070 a un débit maximal de 3 triangles rendus par cycle (contre 4 sur la GTX 1080), et que son fillrate est limité à 48 pixels par cycle. Même si l'interface mémoire est complète avec 64 ROP, chaque GPC ne peut débiter que 16 pixels par cycle. Voici dans le tableau de spécifications final :

La disponibilité de la GeForce GTX 1070 est toujours annoncée pour le 10 juin pour la Founders Edition. Les modèles personnalisés devraient ensuite arriver rapidement, d'autant plus qu'ils seront probablement basés sur le même design que les GTX 1080 personnalisées.

Les spécifications de la GeForce GTX 1070 (maj)

Publié le 19/05/2016 à 14:17 par Damien Triolet

Mise à jour du 19/05 : correction de l'actualité suite à la confirmation des spécifications de l'interface mémoire de la GTX 1070.

Nvidia a mis en ligne les spécifications principales de la GeForce GTX 1070 alors que précédemment seule sa puissance de calcul avait été communiquée. Nous découvrons donc qu'elle sera équipée de 1920 unités de calcul, soit de 75% d'unités actives sur le GP104. Nvidia annonce par ailleurs une fréquence de base de 1506 MHz et turbo de 1683 MHz, ce qui indique bien que les hautes fréquences ne seront pas réservées à la GeForce GTX 1080. Enfin, la limite de consommation de 150W est confirmée. Rappelons que Nvidia annonce des performances supérieures à celles de la GTX Titan X et donc de la GTX 980 Ti, ce qui ne paraît pas insensé sur base de ces spécifications.

Ces spécifications basiques ne sont cependant pas suffisantes pour cerner précisément la GeForce GTX 1070. Deux grandes inconnues subsistent à l'heure actuelle.

Premièrement, Nvidia pourrait avoir désactivé une partie des ROP, du cache L2 et de son interface mémoire interne, comme pour la GeForce GTX 970. Cela réduirait la largeur effective du bus mémoire de 256-bit à 224-bit et seuls 7 des 8 Go de GDDR5 seraient accessibles à pleine vitesse. Certes vous nous direz que sur la page de spécifications de la GTX 1070  Nvidia mentionne une bande passante de 256 Go/s qui correspond bien à un bus mémoire de 256-bit. Rappelons cependant que sur ce point Nvidia ne communique pas la vraie spécifications sur la page de la GeForce GTX 970 , et mentionne une bande passante de 224 Go/s alors qu'elle est en pratique limitée à 196 Go/s (183 Gio/s). Le doute subsiste donc.

Une inconnue subsiste, nous ne pouvons pas savoir comment Nvidia désactive les 640 unités de calcul. Elles correspondent à 5 SM et il est donc possible que Nvidia désactive un GPC complet (avec un rasterizer) ou répartisse les SM désactivés dans les 4 GPC du GPU de manière à conserver les 4 rasterizers. Il est possible également qu'il y ait sur ce point de la variabilité entre les GTX 1070 commercialisées.

Si Nvidia réparti les SM désactivés, le fillrate pourra atteindre 60 pixels par cycle (4 par SM restants) contre 64 pour la GTX 1080 et le débit de triangles rendus restera de 4 par cycle, comme sur la GTX 1080. Et bien entendu, dans la même situation mais si le nombre de ROP était limité à 56, le fillrate serait lui aussi limité à 56 pixels par cycle.

Si par contre Nvidia désactive un GPC complet, le fillrate sera limité à 48 pixels par cycle (16 par GPC restants) et le débit de triangles rendus chutera à 3 par cycle.

Nous avons représenté dans le tableau de spécifications deux possibilités extrêmes par rapport à ces deux points qui restent en suspens, à savoir le nombre de ROP et leur impact ainsi que l'organisation de SM actifs et leur impact. Précisons que ces deux points ne sont pas liés et que les spécifications réelles pourront être intermédiaires :

Alors, la GeForce GTX 1070 sera-t-elle au top ?

Top articles