Les contenus liés au tag GK110

Afficher sous forme de : Titre | Flux Filtrer avec un second tag : CUDA; GeForce; GeForce 700; GPGPU; GTC; GTX 780 Ti; GTX Titan Z; Kepler; Nvidia; Tesla;

Dossier : Nvidia GeForce GTX 780 Ti en test : le GK110 enfin au complet !

Publié le 07/11/2013 à 15:00 par Damien Triolet

Nvidia n'aura pas tardé ! Inconcevable de laisser la première place à AMD, la GeForce GTX 780 Ti a dès lors pour mission de mettre tout le monde d'accord en reprenant le titre...

[+] Lire la suite

La GeForce GTX 780 Ti en approche

Publié le 18/10/2013 à 17:45 par Damien Triolet

Sans dévoiler ses spécifications, Nvidia vient d'annoncer l'arrivée d'une nouvelle GeForce haut de gamme, la GTX 780 Ti. L'arrivée dans le commerce est actuellement prévue pour la mi-novembre pour cette nouvelle carte graphique qui prendra place entre les GeForce GTX 780 et GTX Titan, dont elle reprendra le design de référence.


L'écart entre ces deux modèles est plutôt réduit, la première étant équipée de 12 SMX sur les 15 que comprend le GK110 alors que la seconde en profite de 14. Il est donc possible que la GeForce GTX 780 Ti soit équipée de 13 SMX ou bien tout simplement qu'il s'agisse d'une GeForce GTX Titan 3 Go puisque nous avons pu observer qu'il s'agit de la quantité de mémoire qu'elle embarque. De quoi contrer la Radeon R9 290X ?

Nvidia Quadro K6000: GK110 complet et 12 Go

Publié le 23/07/2013 à 15:42 par Damien Triolet

Lorsque Nvidia a dévoilé la famille de Quadro Kepler, en mars dernier, nous avions été étonnés de ne pas y retrouver de Quadro K6000 architecturée autour du GPU GK110, le plus complexe de cette génération. Elle était cependant bien au programme et Nvidia profite du SIGGRAPH pour l'officialiser.


La Quadro K6000 est le premier produit à embarquer un GPU GK110 complet, c'est-à-dire sans unités de calcul désactivées. Rappelons que les GPU Kepler sont conçus sur base d'un assemblage de SMX, des blocs de 192 unités de calcul, et que pour faciliter la production de ce monstre de 7.1 milliards de transistors, Nvidia en désactive 1 à 3 suivant les produits :

GeForce GTX 780 : 12 SMX
GeForce GTX Titan : 14 SMX
Tesla K20 : 13 SMX
Tesla K20X : 14 SMX
Quadro K6000 : 15 SMX

Avec 15 SMX, et donc 2880 unités de calcul, qui tournent à 900 MHz, la Quadro K6000 affiche une puissance de calcul de 5.2 Tflops en simple précision soit une progression d'un peu plus de 30% par rapport à l'accélérateur Tesla K20X. Et cela en réduisant le TDP de 235W à 225W, probablement à travers une technique de contrôle de la consommation dérivée du GPU Boost des GeForce. Toutes les fonctionnalités introduites par les Tesla K20 (Hyper Q, Dynamic Parallelism, calcul double précision rapide, ECC) sont bien entendu au programme puisque les Quadro représentent un superset des accélérateurs dédiés au calcul massivement parallèle, avec en plus toute la partie logicielle et certification liée au graphisme professionnel.

Particularité de cette Quadro K6000, elle embarque pas moins de 12 Go de mémoire GDDR5 (1.5 GHz) interfacés en 384-bit, pour une bande passante qui atteint 268 Gio/s. Cette quantité importante de mémoire est mise en avant par Nvidia comme un des points forts de cette nouvelle Quadro et est sans aucun doute la raison de son arrivée tardive puisque pour la mettre en place Nvidia a dû attendre la disponibilité d'une GDDR5 haute densité (4 Gbits – 512 Mo par puce) dont la production en volume vient de débuter.


Par rapport à l'ancien haut de gamme, la Quadro 6000, l'évolution apportée par la Quadro K6000 est conséquente : bande passante doublée, quantité de mémoire doublée, puissance de calcul simple précision quintuplée et fonctionnalités plus avancées pour le GPU computing. Parmi les usages types visés par cette Quadro K6000, nous retrouvons la prévisualisation en temps-réel (qui se généralise progressivement avec un niveau de qualité qui s'approche du rendu final) ou encore le traitement de données énormes comme c'est le cas pour l'exploration des sols. Nul doute que les logiciels qui sont limités par la composante graphique apprécieront l'évolution, à condition bien entendu d'y mettre le prix.

Avec un écosystème logiciel reconnu et des spécifications qui dépassent en tout point la FirePro W9000 concurrente, Nvidia n'a pas réellement de pression au niveau tarifaire. Si Nvidia ne communique pas encore le tarif, qui sera probablement fixé à l'approche de la disponibilité prévue pour la rentrée, nous pouvons l'estimer à 5000 ou 6000€.

Dossier : Nvidia GeForce GTX 780 en test : GK110 pour tous (ou presque)

Publié le 23/05/2013 à 15:00 par Damien Triolet

Nvidia inaugure les GeForce 700 avec la GTX 780 qui n'est autre qu'une GeForce GTX Titan aux spécifications revues à la baisse. De quoi démocratiser quelque peu le plus gros GPU Kepler ?

[+] Lire la suite

GTC: CUDA on ARM: Tegra 3 + Tesla K20

Publié le 20/03/2013 à 06:51 par Damien Triolet

En plus des plateformes CUDA on ARM destinées à simuler de futurs SoC que ce soit pour une utilisation de type périphérique mobile grand public ou de type micro-serveur, des développements se font également autour d'accélérateurs très puissants tels que les Tesla K20.

C'est le cas chez l'européen PRACE qui développe des systèmes dédiés au supercomputing et s'intéresse à CUDA on ARM depuis quelques temps. En collaboration avec le Barcelona Supercomputing Center, PRACE est en train de mettre au point une plateforme ARM équipée en GK110 : Pedraforca v2. Celle-ci est composée d'une carte mini-ITX sur laquelle prend place un module Q7 Tegra 3 dont 4 des lignes PCI Express 2.0 sont connectées à un switch PLX PCI Express 3.0 sur lequel vont venir se greffer un accélérateur Tesla K20 et une carte contrôleur InfiniBand 40 Gbps.


Cette plateforme a la particularité de ne pas rechercher la complémentarité entre les cores CPU et GPU. Grossièrement, le but est d'utiliser le SoC ARM uniquement pour activer un système CUDA plus ou moins indépendant. C'est la raison pour laquelle le Tesla K20 est associé à un contrôleur InfiniBand sur un même switch PCI Express 3.0 : ils peuvent ainsi communiquer très rapidement avec les accélérateurs d'autres nœuds en ignorant autant que possible la communication avec les SoC et leurs mémoires.

Les développeurs de Pedraforca v2 sont bien conscients qu'une telle approche n'est pas une solution de remplacement générale à un système CUDA classique et se contentera de répondre avantageusement à un sous-ensemble de problématiques : si un problème massivement parallèle peut être résolu sans CPU, autant réduire l'encombrement et la consommation de celui-ci.

Une telle solution permet par ailleurs de simuler le comportement de futurs GPU haut de gamme qui pourraient intégrer un ou plusieurs cores ARMv8 Denver pour gagner en indépendance. De quoi commencer à préparer des algorithmes qui leur seront adaptés ?

Top articles