Les contenus liés aux tags GPGPU et Tesla

Les 5 contenus de cette page

Les 5 contenus suivants

Nvidia lance la Tesla K80: double GK210 avec Boost

Nvidia annonce la Tesla K40 et CUDA 6

GTC: Tesla passe à Kepler avec les K10 et K20

Computex: serveurs avec GPUs chez Supermicro

Tesla 20 et Fermi : plus de détails

Nvidia dévoile des Tesla 20 avec Fermi

Tags : Fermi; GPGPU; Nvidia; Tesla;

Publié le 16/11/2009 à 15:18 par Damien Triolet

A l’occasion du salon SuperComputing 2009 qui se tient à Portland, Nvidia a décidé de lever le voile sur les premières cartes à exploiter sa future architecture Fermi. Pour rappel il s’agit du nom de code de la déclinaison haut de gamme de la nouvelle architecture GPU de Nvidia que nous vous avions présentée il y a un peu plus d’un mois et qui apporte de nombreuses avancées importantes pour la transition du GPU vers une unité de calcul massivement parallèle flexible et efficace.

Salon SuperComputing oblige, ce sont les versions Tesla de Fermi qui sont dévoilées aujourd’hui avec pas moins de 4 produits : Tesla C2050, Tesla C2070, Tesla S2050 et Tesla S2070. Comme avec les gammes précédentes, les versions C représentent une carte seule alors que les versions S correspondent aux racks 1U équipés de pas moins de 4 cartes C.

Bien que les produits et leur tarification soient annoncés, les spécifications exactes n’ont pas encore été dévoilées par Nvidia, les produits n’étant en réalité pas encore prêts. Si nous savons maintenant que les version 50 seront équipées de 3 Go contre 6 Go pour les versions 70, les fréquences tant du GPU que de la GDDR5 restent inconnues. Le fabricant attend probablement que les tests sur la dernière révision de la puce soient terminés pour fixer les fréquences finales. Nvidia donne cependant une fourchette de puissance de calcul en double précision avec 520 à 630 Gflops, ce qui correspond à une fréquence pour les unités de calcul de 1 à 1.2 GHz, ce qui nous a surpris puisque c’est relativement faible. Pour rappel, dans notre analyse de Fermi, nous avions pris pour exemple une fréquence pour les unités de calcul de 1.6 GHz en estimant être relativement conservateurs.

Cette fréquence faible, malgré la gravure en 40 nanomètres, permet cependant à Fermi de se démarquer considérablement des cartes Tesla actuelles en double précision, son architecture étant particulièrement bien fournie à ce niveau. Par contre, du coup, Nvidia ne parle pas de la puissance de calcul en simple précision qui sera comprise entre 1040 à 1260 Gflops contre 933 Gflops pour les cartes Tesla C1060 et 1036 Gflops pour les GPUs du système Tesla S1070. Des chiffres qui sont alors tout sauf impressionnants sur le papier, d’autant plus par rapport au GPU haut de gamme d’AMD, Cypress, qui affiche 544 Gflops en double précision et 2720 Gflops en simple précision.

Mais il faut rappeler que Fermi dispose d’une architecture nettement plus évoluée, notamment au niveau du sous-système mémoire et que la puissance de calcul des cartes Tesla actuelles est quelque peu surévaluée, Nvidia ayant décidé, pour afficher des chiffres 50% plus élevés, d’inclure certaines unités de calcul qui ne sont que partiellement exploitables en pratique. L’un dans l’autre, les Tesla série 20 apporteront donc un gain conséquent en simple précision également, bien que cela ne saute pas aux yeux au niveau des chiffres officiels. Reste que par rapport à l’offre AMD, et en ignorant la couche logicielle plus avancée chez Nvidia, il est difficile de tirer des conclusions sur base de ces chiffres sans avoir pu voir ce dont est capable Fermi en pratique.

Faut-il s’inquièter de cette fréquence relativement faible ? Elle pourrait en effet témoigner d’un souci au niveau de la production de cette puce très complexe qui représente pas moins de 3 milliards de transistors. Il est également possible que Nvidia ait décidé de réserver les GPUs qui tiennent les plus hautes fréquences aux GeForce, ce serait cependant étonnant puisque la gamme Tesla exploite en général les meilleurs échantillons pour garantir une fiabilité optimale.

La raison pourrait donc plutôt provenir de la consommation de la carte et de son déploiement dans les plateformes existantes. Nvidia annonce une consommation maximale de 225W (consommation typique de 190W) pour une carte Tesla C2070 et une consommation maximale de 1200W (consommation typique de 900W) pour un système Tesla S2070. Pour info une carte Tesla C1060 est annoncée avec une consommation maximale de 190W et un système Tesla S1070 à 800W (consommation typique de 700W). Une gourmandise qui pourrait rendre la montée en fréquence difficile, d’autant plus que Nvidia doit vouloir réutiliser les plateformes actuelles pour éviter de devoir en redévelopper et revalider de nouvelles et ainsi perdre beaucoup de temps alors que la stratégie semble être de commercialiser les dérivés Tesla au plus vite, soit au second trimestre 2010.

Enfin, il est également possible que l’architecture Fermi soit tout simplement suffisamment efficace que pour pouvoir se contenter de fréquences réduites, d’autant plus que son exploitation plus aisée suffira à convaincre de nombreux développeurs, nous n’avons aucuns doutes à ce sujet. Reste bien entendu à voir ce que Nvidia nous réserve du côté des GeForce : quelles seront les fréquences et les spécificités graphiques de cette architecture ?

Computex : serveur Tesla chez Supermicro

Tags : Computex 2009; GPGPU; Nvidia; Supermicro; Tesla;

Publié le 04/06/2009 à 08:12 par Damien Triolet

Annoncé par Nvidia juste avant l’ouverture du Computex, nous avons pu observer le nouveau serveur de Supermicro plus en détail. Celui-ci, au format 1U, est capable d’accueillir deux cartes Tesla, 2 CPUs et 3 disques durs. Il s’agit donc bien d’un serveur complet contrairement au serveur Tesla S1070 qui ne contient que les accélérateurs et doit donc être connecté à un serveur maître.

Dans sa configuration par défaut, le serveur repose sur une plateforme bi-Xeon 5500 (Nehalem) et 2 accélérateurs Tesla M1060. Elle peut prendre en charge jusqu’à 48 Go de mémoire en plus des 8 Go présents au total sur les 2 cartes Tesla. Supermicro nous a précisé qu’il était possible d’utiliser une plateforme différente, soit en mono-CPU, soit en Xeon de la génération précédente, soit en Opteron. Il est également possible d’utiliser des cartes Tesla C1060 à la place des M1060, la différence étant leur format. Les premières sont des cartes classiques, équipées d’un ventilateur alors que les secondes ne disposent que d’un gros radiateur à travers lequel doit passer un flux d’air suffisant, ce qui est le cas sur ce serveur.

Supermicro nous a indiqué une disponibilité prévue pour dans 2 semaines en précisant que sa commercialisation était prioritaire pour la société compte tenu des nombreuses commandes déjà enregistrées, ce qui témoigne bien de l’intérêt porté à ces accélérateurs massivement parallèles. Il s’agit également d’un produit très important pour Nvidia qui dispose maintenant d’un acteur reconnu dans le milieu des serveurs pour mettre en avant Tesla.

Quant au prix de ce serveur, dans sa configuration de base, il faudra compter entre 8 et 12.000 euros selon les marges que prendront les distributeurs. Enfin notez que Supermicro prépare un second serveur Tesla, au format 4U et qui pourra cette fois accueillir 4 cartes Tesla.

Computex : Nvidia mise sur GPU Computing

Tags : Computex 2009; CUDA; GPGPU; Nvidia; Tesla;

Publié le 01/06/2009 à 20:49 par Damien Triolet

Le fabricant de GPUs a tenu une première conférence, avant l'ouverture officielle du Computex, qui était principalement tournée sur le GPU Computing.

Nvidia a pu annoncer l'arrivée chez SuperMicro d'un serveur équipé d'une plateforme Intel et d'accélérateurs Tesla offrant 2 teraflops en occupant seulement 1U. Les solutions proposées par Nvidia tiennent également dans 1U mais n'embarquent que les GPUs et doivent donc être liée à un serveur maître. La solution de SuperMicro présente donc un intérêt important même si nous n'en connaissons pas encore les spécifications exactes. Tout au juste pouvons nous déduire des 2 teraflops qu'elle sera équipée du côté GPU de 2 GT200b.

Jen-Hsun Huang, President & CEO, Nvidia.
Du côté grand public, Nvidia s'est félicité du nombre croissant d'applications capables de tirer partie du GPU en tant que coprocesseur parallèle tout en précisant que ce n'était qu'un début puisque l'arrivée de DirectX 11 et de Windows 7 devrait accélérer la tendance. Le premier permettra d'exploiter les GPUs (y compris les versions actuelles !) d'une manière standardisée à travers les Compute Shaders. Le second, en plus d'inclure DirectX 11 à sa base, intégrera un transcodeur capable d'exploiter les GPUs, à travers les Compute Shaders, pour accélérer la conversion des vidéos.

Microsoft et Nvidia mettent en avant la prise en charge native du GPU dans Windows 7 pour accélérer le transcodage vidéo.
Grâce à CUDA, Nvidia a pris une nette avance sur la concurrence du côté du GPU Computing puisque le fabricant est prêt depuis longtemps du côté logiciel. Si à l'avenir tous les composants devraient être supportés, dans l'immédiat, l'avance prise du côté logiciel permet aux GeForce de profiter de la primeur de ces accélérations dans quelques applications principalement dédiées au traitement des vidéos. Il en va de même avec PhysX qui offre aux GeForce le premier support matériel pour la physique d'effets.

Pour appuyer sa vision Nvidia a cependant recours à des artifices grossiers dont la société use et abuse et qui finissent par transformer un sujet intéressant en caricature de communication. Par exemple pour convaincre la presse que le GPU en tant que coprocesseur est l'avenir du PC, l'argument de Jen-Hsun Huang, CEO de Nvidia, est de dire que tout le monde affirme que c'est le cas. Sous-entendu « vous la presse devez écrire la même chose pour ne pas avoir l'air ridicule ». Autre exemple, quand Nvidia nous fait la démonstration d'un jeu avec effets physiques accélérés par le GPU, le volume sonore est réduit de moitié lorsque ces effets sont désactivés, pour accentuer la sensation de perte d'immersion.

Mais ce qui nous ennuie le plus, c'est la simplification qui consiste à présenter un élément d'une unité de calcul vectorielle des GeForce comme étant un core. Une simplification qui devient de plus en plus tordue à mesure que les GPUs et les CPUs s'affrontent. Si la rhétorique de Nvidia est acceptée, alors un CPU quadcore devrait être vu comme composé d'au moins 16 cores compte tenu de ses unités vectorielles. Tout le monde crierait alors au ridicule et à raison. Nvidia est cependant coincé puisqu'après avoir utilisé à la base de son marketing les cores de cette manière il est difficile de revenir en arrière. Comment dire maintenant que le GT200 est en fait composé de 10 voire 30 cores et non pas de 240 ?

Nvidia détaille sa stratégie

Tags : GPGPU; Nvidia; Tesla;

Publié le 26/05/2008 à 22:56 par Nicolas Gridelet / source: Beyond3D

Logo Nvidia Michael Hara, vice-président Investor Relations, et Daniel Vivoli, vice-président senior Marketing ont donnés des informations intéressantes la semaine dernière à la JP Morgan Technology Conference.

Pour la première fois, une explication claire a été fournie sur les yields de G92 qui se sont révélés inférieurs aux attentes. D'après M. Hara, il s'agirait plus d'un problème lié à une procédure de validation trop stricte que d'un problème de production. Le passage au G92b qui devrait être gravé en 55nm aidera à résoudre ces difficultés. Toujours à propos de ce GPU, sa durée de vie est prolongée pour une période comprise entre 6-8 et 12 mois. Tout ce qui va être annoncé dans les 3-4 prochains mois est plus puissant selon les employés de la firme au caméléon. Effectivement, puisqu'il n'y aura que peu de différences en termes de fonctionnalités, le G92(b) peut aisément redescendre dans la gamme pour un temps, en attendant l'arrivée d'un milieu de gamme "sur mesures" si besoin est.

L'optimisme est de mise concernant la gamme de produit Tesla qui s'adresse au marché de la puissance de calcul. Cependant, le marché actuel n'est pas encore celui qui est vraiment visé. Il est vrai que diminuer l'importance relative du CPU peut prendre du temps, mais certaines perspectives, tels les supercalculateurs "personnels" pour les scientifiques, semblent prometteuses.

Coté chipsets, l'objectif de 25% de parts de marché (sur la partie ou Nvidia peut être présent) sur la plateforme Intel reste de mise. Le fabricant vert ne s'attaquera pas au segment "ultra-low-end" où la qualité et la marque ne jouent pas, ce qui implique que l'on ne peut rivaliser que sur les coûts. En clair, il veut donc atteindre 15% à 20% de parts sur cette plateforme. L'arrivée prochaine des Nehalem et l'intégration du GPU dans le CPU ne fait pas peur à Nvidia, et l'Hybrid SLI pourrait ici être un atout majeur.

Concernant l'APX 2500, les premiers "design wins" seront concrétisés au troisième ou au quatrième trimestre de cette année par l'arrivée d'assistants de navigation personnels qui en seront équipés. Pour les lecteurs numériques portatifs, il faudra attendre le quatrième trimestre voir début 2009. Et M. Hara de déclarer qu'aucune autre société n'aurait pu viser ces deux marchés ainsi que celui des smartphones avec une seule et même puce. À terme, son prix devrait se situer entre $8 et $12.

Nvidia lance Tesla

Tags : CUDA; GPGPU; Nvidia; Tesla;

Publié le 21/06/2007 à 00:12 par Damien Triolet

C'est aujourd'hui que Nvidia a décidé de dévoiler une toute nouvelle gamme de produit : Tesla. Après la gamme GeForce destinée au grand public et aux joueurs, la gamme Quadro destinée au professionnel de l'image, la gamme Tesla s'attaque au marché de la puissance de calcul.

Nvidia concrétise ainsi son initiative lancée avec la GeForce 8800 et CUDA, la composante qui permet d'exploiter le GPU en tant que coprocesseur mathématique via des extensions au langage C. AMD, via ATI, a été le premier à annoncer une telle interface avec la CTM, en assembleur cette fois, et a également été le premier à annoncer un produit spécifique à ce marché avec le Stream Processor. Reste qu'en dehors de ces annonces et des démos réalisées par AMD, nous n'avons encore rien vu de concret, le tout étant toujours réservé à une poignée de développeurs, la CTM n'étant pas publique et les nouveautés annoncées avec les Radeon HD 2000 toujours en développement

De son côté, Nvidia a publié une version beta de CUDA (0.8) en février et nous a fourni une version plus avancée (0.9) avant la sortie de la version 1.0 prévue pour la semaine prochaine. Nous avons ainsi pu constater que la composante logicielle a fortement évolué. Par ailleurs, nous avons pu voir de nombreuses exploitations réelles du GPU démontrées par différentes sociétés lors de la présentation de Tesla il y a quelques semaines, preuve que CUDA est maintenant réellement utilisable.

Dans un premier temps, Nvidia annonce 3 produits. Le premier, le Tesla C870 est en quelque sorte une GeForce 8800 GTX dépourvue de sorties vidéo et donc destinée uniquement à servir d'accélérateur. La carte est par ailleurs équipée de 1.5 Go de mémoire vidéo au lieu de 768 Mo. Son prix est fixé à 1299$ ce qui reste raisonnable puisqu'une Quadro FX 5600 équipée elle aussi de 1.5 Go de mémoire coûte 2999$. La TDP est de 170W.

Le second élément de la gamme est le Tesla D870 qui reprend le concept des Quadro Plex. 2 cartes Tesla C870 prennent ainsi place dans un boîtier externe qui se raccorde au PC via une carte PCI express spéciale ainsi qu'un câble adapté. La TDP passe à 350W et le prix fait un bond à 7500$ ce qui reste malgré tout "bon marché" face au Quadro Plex de Quadro équivalentes proposé à 17500$. 2 de ces boîtiers peuvent prendre place dans une baie et occupent alors ensemble 3U.

Enfin le 3ème produit de la gamme est un rack 1U, le Tesla S870, équipé de pas moins de 4 Tesla C870, soit 4 G80 et 6 Go de mémoire vidéo en tout. Le rack se connecte à un système principal également en PCI Express et est déjà prêt pour le PCI Express 2.0 et ainsi booster les transferts entre le ou les CPU et les GPUs. La TDP est de 800W bien que Nvidia annonce une consommation qui en pratique se situe en général autour de 550W. Ce rack 1U est commercialisé au prix de 12000$.

Nvidia est donc paré pour essayer de s'introduire sur le marché de la puissance de calcul et concrétise ainsi la longueur d'avance prise sur AMD au niveau de la partie logicielle.

Concernant la stratégie à plus long terme de CUDA, Nvidia nous rassure sur le fait qu'il restera proposé sur toute la gamme de produits, Quadro et GeForce et ne sera pas réservé aux Tesla. CUDA devrait d'ailleurs bientôt faire partie intégrante des drivers grand public. Cependant, à l'avenir, certaines fonctions de CUDA ou des futurs GPUs pourraient être réservées à Tesla. Ce sera notamment le cas de la précision de calcul de 64 bits sur les flottants qui sera introduite avec le G92 et réservée aux Tesla (et à quelques Quadro haut de gamme).

Plus de détails dans un petit article qui sera publié prochainement…

Les 5 contenus de cette page