Tesla 20 et Fermi : plus de détails

Publié le 22/12/2009 à 18:15 par Damien Triolet

Un membre du forum de notre confère italien Hardware Upgrade est tombé sur le document BD-04983-001_v01 de Nvidia qui contient les spécifications des cartes Tesla C2050 et C2070. Un fichier type que nous avons l’habitude de parcourir pour chaque modèle mais qui en principe n’est pas public et est fourni uniquement aux partenaires de Nvidia via des échanges privés ou son extranet. Il mentionne les spécifications de base des cartes ainsi que leurs propriétés physiques.

Etant donné que Nvidia essaye de maintenir le hype sur Fermi en laissant filer tantôt un détail, tantôt une photo, nous pouvons supposer que ce fichier n’est pas apparu par accident. Dans sa situation, continuer à faire parler de son futur GPU est le but principal. Ceci étant dit, ce document nous apporte une information importante qui confirme ce que nous pensons depuis quelques temps.

Lors de l’annonce des cartes Tesla 20, nous avions pointé du doigt la faible fréquence que la puissance de calcul avancée par Nvidia impliquait. C’était bien entendu en supposant que toutes les unités du GPU seraient fonctionnelles, ce qui nous est par la suite apparu de moins en moins probable. D’après les nouvelles informations, 2 cores ou partitions de 32 « cores » sur les 16 que contient le GPU seront désactivées. Les cartes Tesla C2050 et C2070 disposeront donc en réalité de 448 cores actifs cadencés entre 1.25 et 1.4 GHz.

Si nous mettons en relation ces nouvelles données par rapport aux chiffres précédents, à savoir entre 520 et 630 Gflops en double précision, nous obtenons 1.16 et 1.4 GHz. La fourchette est similaire mais légèrement différente, ce qui peut s’expliquer par la date différente de l’évaluation des fréquences ou par une puissance de calcul quelque peu réduite quand la protection ECC est activée. Nvidia donne également des informations sur la mémoire et parle de 1.8 à 2 GHz pour la GDDR5, ce que nous supposons correspondre à la fréquence d’envoi des données, soit 900 à 1 GHz pour l’envoi des commandes, pour une bande passante de 160 à 179 Go/s.

Vous noterez par ailleurs que Nvidia ne place pas de mémoire supplémentaire pour stocker les données de parité et que le bus n’est pas élargi pour la prendre en compte, comme c’est le cas pour la mémoire système des serveurs. Autrement dit, l’activation de l’ECC va réduire la bande passante et l’espace mémoire réellement disponible. Nvidia parle de 2.625 et 5.25 Go au lieu de 3 et 6 Go respectivement pour les cartes Tesla C2050 et C2070. Cela représente un coût de 1/8ème qui sera identique au niveau de la bande passante. Vous remarquerez que le coût en général de la mémoire ECC est de 1/9ème puisqu’un bit supplémentaire de parité est stocké pour 8 bits de données. Nous supposons que c’est le même principe pour Fermi, mais qui doit par contre gérer l’ECC avec un bus qui n’est pas élargi à 9/8ème quand cette technologie est activée. Etant donné qu’il utilise des contrôleurs mémoire 64 bits avec un prefetch de 8 bits, soit des accès de 512 bits, nous pouvons imaginer que l’ECC prend place dans cette structure. Ainsi, sur les 512 bits, 448 seraient réservés aux données, 56 pour la parité et 8 bits seraient perdus. Reste à savoir si le coût du calcul et du contrôle de la parité est important, faible ou nul, s’il est traité par des unités dédiées dans le contrôleur mémoire où via les cores…

Au final, nous avons donc 448 « cores », à 1.25/1.4 GHz et de la mémoire GDDR5 à 1.8/2.0 GHz. Pas très impressionnant diront certains. Sur le plan de la puissance de calcul, les Radeon HD 5870 font mieux et n’ont pas un gros désavantage en bande passante mémoire malgré leur bus plus petit. Mais il faut garder en tête qu’il s’agit ici des cartes Tesla, pas des GeForce, pour lesquelles le niveau de tolérance est beaucoup plus strict et le câblage de la mémoire est rendu plus complexe puisqu’il faut placer le double de puces pour supporter 3 Go et 6 Go. Un élément d’inquiétude légitime concerne les 2 partitions désactivées alors que nous aurions pu penser que Nvidia utiliserait les meilleurs exemplaires de Fermi, c’est-à-dire complètement fonctionnels pour les cartes Tesla. Ce n’est qu’à moitié étonnant selon nous, puisque nous avons déjà observé de grosses castrations sur les Quadro et que l’intérêt de Fermi pour ce marché viendra bien plus de ses avancées architecturales et de ce qu’elles impliquent au niveau logiciel que de sa puissance de calcul. Passer de 16 à 14 partitions ne réduit donc pas l’intérêt du produit.

Que se passera-t-il pour la version GeForce ? Tout est possible et va dépendre de la qualité de la production et des performances de Fermi par rapport à l’offre actuelle d’AMD. Si Nvidia peut le faire et en a besoin pour battre AMD, il est évident qu’une GeForce équipée d’un Fermi complètement fonctionnel verra le jour. Elle pourra également profiter d’une GDDR5 plus rapide et d’une bande passante mémoire en hausse d’au moins 20%.

L’élément le plus inquiétant dans tout cela concerne la consommation de Fermi. Les cartes Tesla C2050 et C2070 sont annoncées avec un TDP de 225 watts. Les GeForce feront l’économie de la moitié des modules mémoire, mais consommeront probablement au final plus à cause de fréquences en hausse et d’éventuellement 2 partitions actives en plus. La consommation risque donc d’être un élément important dans la détermination des spécifications des GeForce Fermi.

Notez pour finir que si le consensus actuel semble être établi sur une disponibilité pour mars, nous estimons toujours de notre côté qu’elle devrait intervenir plus tôt, bien que probablement avec une disponibilité limitée. Selon nos informations la révision qui sera utilisée pour la production est prête et c’est plutôt le côté logiciel qui doit maintenant être finalisé, sujet sur lequel certaines de nos sources se veulent rassurantes alors que d’autres indiquent qu’il y a encore du pain sur la planche. Une chose est sûre, les développeurs de Nvidia ne vont pas prendre 2 semaines de congés pendant les fêtes comme c’est le cas chez AMD !

Vos réactions

Tesla 20 et Fermi : plus de détails

Contenus relatifs

Top articles