Preview : NVIDIA GeForce 6800 Ultra

Publié le 14/04/2004 par et
Imprimer
Les registres
NVIDIA s´est-il débarrassé de toute contrainte liée aux registres ? Autant être clair : non. Les ingénieurs ont dû estimer qu´il n´était pas nécessaire de disposer physiquement autant de registres que nécessaires pour qu´ils ne limitent jamais les performances et qu´il était plus intéressant d´utiliser les transistors à quelque chose d´autres, ce qui n´est pas spécialement faux. NVIDIA a cependant fait tout pour reculer la limite.

Le constructeur nous a ainsi indiqué qu´il n´y aurait plus de perte de performances avec 4 registres 128 bits (FP32) et que les registres utilisés par le texturing resteraient dorénavant dans le texture cache avant d´être utilisé dans le shader de manière à ne pas prendre de la place pour rien.

Nous avons bien entendu voulu vérifier l´incidence du nombre de registres sur les performances. Nous ne pouvons cependant pas vous fournir de données claires et nettes à ce sujet. Observer la limitation des performances due aux registres est devenu très difficile. Le compiler est maintenant efficace par rapport aux registres et capable d´en réduire le nombre réellement utilisé. Nos observations nous ont malgré tout permis de constater qu´il y avait un gros mieux par rapport aux GeForce FX.

Qui plus est nous avons constaté que la limite s´était en partie modifiée et qu´au niveau effectif elle devenait souvent une limite par passe dans le pipeline au lieu d´une limite absolue. Ceci peut-être dû à plusieurs raisons et seul NVIDIA connaît ces détails. Néanmoins ce n´est pas un mal puisque le groupe d´opérations réalisées dans un passage est susceptible d´utiliser les mêmes registres.
Performance en pixel shading
16 pipelines, des unités de calcul par paquet de 10 et une gestion des registres complexe c´est très bien, mais qu´est-ce que ça apporte en pratique ? Les Pixel Shader sont-ils réellement calculés plus rapidement ?


Dans Rightmark 3D (résultats en fps en 1600*1200), nous avons cadencé les 3 cartes aux mêmes fréquences : 200 MHz pour le core et 400 MHz pour la mémoire. Ces tests montrent clairement que la nouvelle architecture de NVIDIA est très performante, la différence par rapport au NV38 est d´ailleurs frappante. Ils indiquent également que NVIDIA profite toujours du mode FP16 qui permet d´utiliser plus de registres sans perte de performances. Le "problème" est donc toujours bien là mais réduit puisqu´il n´est présent que sur un des 2 shaders alors qu´il l´est sur les 2 avec le NV35. Pour rappel, les Radeon exécutent ces shader en 24 bits.


Ce second test a été effectué avec des pixel shader 2.0 extraits d´applications courantes et exécutés sous une autre application (résultats en Mpixels /s). Ici les tests ont été effectués avec les fréquences réelles des cartes.

Pour FarCry, nous avons utilisé un même shader en version normale et en version optimisée GeForce FX. Force est de constater que la version optimisée offre les mêmes performances que la version normale, ceci étant probablement dû au fait que le compilateur intégré aux drivers transforme automatiquement la version normale en version optimisée. Vous noterez que la Radeon ne peut pas faire tourner la version GeForce FX, du fait d´une limitation au niveau des lectures de textures dépendantes sur les Radeon.

Avec le shader tiré du dernier Tomb Raider, la 6800 Ultra montre clairement qu´elle joue dans une toute autre catégorie que la FX5950 en étant 5x plus rapide ! Le shader tiré du test PS2 de 3DMark03 est lui aussi intéressant. A lui seul il représente les capacités globales en shading des 3 cartes : GeForce 6800 Ultra = 2x Radeon 9800 XT et Radeon 9800 XT = 2x GeForce FX 5950. Il est intéressant de remarquer que le GeForce FX 5950 est ici 2x moins performant que le Radeon alors qu´il affiche un score identique quand le même shader tourne dans 3DMark03...
Performances en Z rendering et en texturing
Les cartes graphiques ne font pas que calculer des pixel shader, du moins pas encore. Il est donc important qu´elles soient efficaces quand il s´agit de s´occuper d´autres tâches.


Ce test rapide, dont les résultats sont exprimés en Mpixels /s, montre clairement que tout comme les GeForce FX 5800 et 5900, le GeForce 6800 est capable de calculer les passes ne s´occupant que des données Z avec un débit double. Un jeu comme Doom III devrait en profiter, reste à voir dans quelle mesure exactement.


Ces petits tests (en Mpixels /s) nous indiquent plusieurs choses. Premièrement, le GeForce 6800 a bien une seule unité de texturing, mais ça nous le savions déjà. Ensuite il est nettement limité par sa bande passante quand il s´agit de faire un alpha blending (mélange de texture par rapport à un paramètre de transparence) alors que le GeForce FX 5950 est capable de le faire sans perte de performances ou presque.

Ceci est assez logique vu que le GeForce FX 5950 a bien plus de bande passante que de fillrate. Et enfin vous remarquerez qu´avec 4 textures les performances chutent sur le GeForce FX 5950 alors qu´en théorie elles devraient être identiques que ce soit avec 3 ou 4.
Vos réactions

Top articles