Nvidia lance les GT 610, 620 et 630

Publié le 16/05/2012 à 17:02 par
Imprimer

Nvidia a lancé ces derniers jours trois nouvelles références d'entrée de gamme, les GeForce GT 610, 620 et 630. Ces cartes ne sont pas complètement nouvelles puisqu'il s'agit pour la plupart de renommages de produits déjà existants, utilisant tous l'architecture précédente Fermi. Nous avons récapitulé dans ce tableau les caractéristiques annoncées pour ces cartes, en notant bien sur qu'elles sont fournies à titre indicatif : sur l'entrée de gamme, les partenaires de Nvidia (il en va de même pour les partenaires d'AMD sur l'entrée de gamme) ont les mains libres et peuvent changer, souvent drastiquement, les fréquences et la configuration.


Côté renommage direct on retrouve donc les GT 610 qui remplacent les GT 520 tandis que du côté des GT 630 c'est la GT 440 qui est remplacé, aussi bien en version DDR3 que GDDR5. La GT 620 est un cas un peu plus particulier puisqu'il s'agit d'une GT 430… castrée ! On passe en effet d'un bus mémoire 128 bits à 64 bits ce qui aura bien entendu un impact net sur les performances.

Notez pour conclure que nous parlons ici des modèles vendus dans le commerce. La confusion s'épaissit lorsque l'on prend en compte les versions "OEM" de ces cartes. La GT 610 est remplacée par une GeForce 605 dont la fréquence passe de 810 MHz à 523. La GeForce GT 620 OEM de son côté voit sa fréquence augmenter jusqu'à 810 MHz. Pour terminer, on retrouve plusieurs versions de la GT 630 OEM car en plus de versions basées sur le GF108, on retrouve une version utilisant une puce Kepler, le GK107. La carte compte 192 unités shaders pour une fréquence de 875 MHz… et est accompagnée exclusivement de DDR3 !

GTC: VGX: la virtualisation sur GPU pour les pro

Tags : GTC; Kepler; Nvidia;
Publié le 16/05/2012 à 04:11 par
Imprimer

Avec les GPU de la famille Kepler, Nvidia a apporté plusieurs petites évolutions qui permettent de les virtualiser. Si les infrastructures de bureaux virtuels (VDI) commencent à gagner en popularité dans le monde de l'entreprise, elles souffrent actuellement de limitations importantes, le rendu des bureaux devant être traité par les CPU.

Pour permettre à ces VDI d'offrir une expérience de meilleure qualité, avec un bureau Windows accéléré, du multimédia voire un peu de 3D, Nvidia dévoile une nouvelle solution dénommée VGX qui permet d'ajouter des GPU virtualisés dans les serveurs.

VGX repose 3 composantes principales. Tout d'abord l'Hypervisor qui gère le partage des ressources GPU entre de nombreux utilisateurs et permet à une machine virtuelle de communiquer directement avec le ou les GPU.


Ensuite nous retrouvons bien entendu le côté matériel avec un produit développé spécifiquement pour ce marché : la carte VGX. Elle embarque pas moins de 4 GPU, que nous supposons être des GK107 castrés avec seulement la moitié de leurs unités de calcul actives. Cela représente 192 unités de calcul par GPU pour un total de 768. Elles sont cadencées à 850 MHz ce qui donne une puissance de calcul totale de 1.3 Tflops. Ce n'est pas énorme mais la puissance de calcul n'est pas le but ici. Nvidia profite par contre des 4 processeurs de commandes de ces GPU, qui sont chacun capables de gérer 32 accès concurrents, avec quelques limitations en pratique. De quoi permettre à Nvidia d'annoncer la prise en charge de pas moins de 100 utilisateurs pour sa carte VGX.


Chaque GPU est accompagné de 4 Go de mémoire DDR3, soit 16 Go au total, et la carte se contente d'un TDP de 150W et d'une longueur de 27cm. C'est plutôt raisonnable au vu des caractéristiques et il est évident que l'efficacité énergétique de l'architecture Kepler permet à Nvidia d'attaquer plus facilement ces nouveaux marchés.

Enfin, la dernière composante se nomme USM pour User-Selectable Machines. Grossièrement il s'agit d'un système de licence qui permet d'activer certaines fonctionnalités qui sont disponibles dans les familles traditionnelles de produits professionnels Nvidia. VGX avec NVS USM permet de profiter des optimisations pour certaines applications business, de la suite multi-écran nView et de l'accélération des applications CUDA qui étrangement n'est pas activée sur la version basique. VGX avec Quadro USM active toutes les fonctionnalités logicielles réservées aux Quadro. Nvidia indique qu'il est possible d'offrir à chaque utilisateur un niveau de fonctionnalité spécifique mais ne donne aucune information sur le modèle commercial.

La solution VGX profite par ailleurs de NVENC, l'encodeur H.264 présent dans tous les GPU Kepler, ce qui a l'avantage de décharger les CPU de cette tâche mais également de réduire la latence, rendu et encodage étant traités directement par le GPU.

Nvidia indique travailler notamment avec Citrix pour intégrer VGX dans leur VDI et, en guise de démonstration, se reposait sur un cas pratique d'Industrial Light & Magic, qui a régulièrement besoin de rencontrer les réalisateurs pour parler des scènes en préparation et devait précédemment se contenter de quelques supports visuels fixes lors de ces réunions. Une solution telle que VGX leur permet de manipuler à distance et en temps réel les projets en cours, de quoi pouvoir répondre directement aux demandes d'un réalisateur, qui désirerait par exemple observer la scène sous un angle spécifique, ou avoir une idée de ce que donnerait une modification.


Depuis son MacBook Air, le responsable d'ILM peut modifier facilement une scène, le tout étant traité à distance sur les serveurs de la société. Dans cet exemple vous pouvez observer l'ajout d'un shredder dans une scène de destruction de Battleship.

GTC: Tesla passe à Kepler avec les K10 et K20

Publié le 16/05/2012 à 01:46 par
Imprimer


Nvidia vient de dévoiler deux nouvelles cartes Tesla basées sur l'architecture Kepler. La première, dénommée K10 est en quelque sorte une version Tesla serveur de la GeForce GTX 690. Il s'agit donc d'une carte équipée de 2 GPU GK104 et d'un switch PCI Express 3.0 PLX. Par rapport à la GeForce GTX 690, les fréquences ont bien entendu été revues à la baisse et passent d'une fourchette de 915 à plus de 1100 Mhz (suivant le niveau de turbo) à 745 MHz pour le GPU et de 1500 à 1250 MHz pour la mémoire.

Nvidia semble ainsi avoir laissé de côté GPU Boost, probablement parce que la variabilité qui y est liée n'est pas compatible avec le monde professionnel. La base de la technologie, qui permet de contrôler dynamiquement la fréquence pour maintenir un certain TDP est par contre de toute évidence de la partie, ce qui permet à Nvidia de proposer un TDP relativement faible qui tourne autour de 225-235W, contre 300W pour la GeForce GTX 690.

La K10 est équipée de 4 Go de mémoire GDDR5 par GPU, soit 8 Go au total, et supporte l'ECC, d'une manière similaire à ce qui se fait sur les précédentes cartes Tesla : une partie de la mémoire est utilisée pour stocker les données de parité, ce qui réduit l'espace mémoire disponible ainsi que la bande passante pratique. La puissance de calcul en double précision reste par contre extrêmement faible, tout comme certaines opérations logique ou sur les entiers, le GPU GK104 étant très limité à ce niveau. En d'autres termes, la carte K10 affiche une puissance de calcul en simple précision flottante énorme, de 4577 Gflops et sera donc destinée à ce type de calculs uniquement. En double précision le débit tombe à 190 Gflops.

La seconde carte Kepler annoncée aujourd'hui, la K20 est la plus intéressante des deux puisqu'elle embarquera un GPU GK110 au sujet duquel Nvidia vient de donner les premières informations. Peu de détails sur la K20 sont communiqués à ce jour, ses spécifications ne seront fixées que plus tard dans l'année puisqu'elle est prévue pour le dernier trimestre 2012. Il est cependant probable qu'elle soit équipée d'un GK110 partiellement castré avec 13 blocs d'unités de calcul actifs sur les 15 disponibles pour un total de 2496 de ces unités de calcul. Nvidia indique par ailleurs que ses performances en double précision seront triplées par rapport à la génération actuelle et supérieures à 1 Tflops, ce qui en fera une carte bien plus polyvalente pour le calcul, d'autant plus que son GPU apporte plusieurs innovations importantes pour faciliter son exploitation avec un maximum d'efficacité.


La carte K20 devrait être accompagnée de 6 Go de mémoire GDDR5 et sera disponible avec un TDP de 225W, ce qui est plutôt impressionnant compte tenu de la complexité de ce GPU. Il est probable que Nvidia profite du fait qu'en général les blocs du GPU dédiés au graphique ne seront pas utilisés pour pouvoir compresser le TDP. Nvidia nous précise cependant que si un intégrateur dispose d'une plateforme certifiée pour un TDP plus élevé, la carte K20 pourra s'y adapter pour profiter de la marge supplémentaire. Elle sera par ailleurs disponible en version workstation en plus de la version serveur.

GTC: Nvidia lève le voile sur le GK110

Tags : GK110; GTC; Kepler; Nvidia; Tesla;
Publié le 16/05/2012 à 00:40 par
Imprimer


Sans le nommer directement, Jen-Hsun Huang, le CEO de Nvidia, vient de dévoiler les premières informations au sujet du "gros" GPU Kepler, le GK110. Nous avons tout d'abord la confirmation qu'il s'agit bien d'un énorme GPU de pas moins de 7.1 milliards de transistors fabriqués en 28nm, un nouveau record. Certains doutes subsistaient par rapport à ce chiffre puisqu'il correspond presqu'exactement à deux GPU GK104, la configuration de la nouvelle carte Tesla K10, mais ce n'est qu'une coïncidence.

GTC oblige, c'est avant tout son intérêt pour le monde professionnel et particulièrement pour le calcul haute performance qui est mis en avant par Nvidia. Deux nouvelles technologies importantes font leur apparition dans ce GPU. Tout d'abord Hyper-Q qui permet d'utiliser jusqu'à 32 queues d'exécution pour alimenter le GPU, contrairement à une seule auparavant. Une limitation qui empêchait dans bien des cas la pleine exploitation de toute la capacité de calcul des GPU.



Hyper-Q permet de maximiser le rendement du GPU et de réduire le temps d'exécution.

La seconde innovation se nomme Dynamic Parallelism et vient également apporter une réponse à un problème d'efficacité actuelle. Le travail à exécuter sur le GPU est en général segmenté, et chacun des segments est initié par le CPU. Entre chacun de ceux-ci, le GPU rend ainsi la main au CPU qui reçoit les résultats d'une fonction, et dans certains cas renvoie ces mêmes résultats au GPU pour lancer une seconde fonction qui en est dépendante. L'inefficacité est évidente. Dynamic Parallelism représente la capacité du GK110 à auto-générer de nouvelles tâches, de quoi éviter ces allers-retours entre le CPU et le GPU.


Cette nouvelle flexibilité dans l'exécution des tâches va faciliter le travail des développeurs d'une part en proposant plus simplement un rendement élevé et d'autre part en leur permettant d'écrire leurs programmes d'une façon plus naturelle.


Enfin, Nvidia a dévoilé une photo du die du GK110, certes retravaillée artistiquement mais qui permet de se faire quelques idées sur les spécifications de ce GPU. On peut tout d'abord observer la présence de 15 SMX et d'un contrôleur mémoire de 6x 64 bits, soit 384 bits. Nvidia nous a confirmé ces spécifications et précisé que les SMX du GK110 seront également équipés de 192 unités de calcul, comme pour le GK104. Leur nombre total sera donc de 2880 et là aussi il s'agit d'un nouveau record, même si Nvidia précise qu'il n'y aura en principe pas de dérivé Tesla équipé d'une version complète de ce GPU, profiter d'un certain niveau de redondance étant nécessaire avec un GPU d'une telle taille, plus de 500mm². La première carte Tesla K20 basée sur le GK110 sera probablement limitée à 13 SMX et 2496 unités de calcul.

Nvidia nous a indiqué que l'organisation des registres et de la mémoire partagée avait été revue, et que la puissance de calcul en double précision était très élevée, mais il faudra patienter encore un jour ou deux avant d'avoir plus de détails sur le sous-système mémoire du GK110.

Sur le plan graphique, nous pouvons supposer que chaque SMX conserve 16 unités de texturing et que leur nombre total dans ce GPU est de 240. L'organisation des SMX en 5 groupes de 3 nous laisse penser que le GK110 serait capable de traiter jusqu'à 7.5 triangles par cycle mais de n'en rendre que 5 ou 6 par cycle (suivant l'implémentation pour laquelle a opté Nvidia), contre 4 et 4 pour le GK104. Enfin, de toute évidence il disposera de 48 ROP.

Ce futur GPU sera tout d'abord introduit à la fin de l'année en tant que Tesla K20 mais ne débarquera pas en tant que GeForce avant début 2013. Il sera bien entendu intéressant d'observer la consommation d'un tel monstre, même si Nvidia se veut rassurant en précisant que la carte Tesla K20 est prévue avec un TDP classique de "seulement" 225W !

Top articles