Nvidia GeForce GTX 280 & 260

Publié le 16/06/2008 par
Imprimer


Performances accès aux textures
Nous avons mesuré les performances lors de l’accès à des textures de différents formats en filtrage bilinéaire et en filtrage trilinéaire. Nous avons conservé les résultats en 32 bits classique (8x INT8), en 64 bits "HDR" (4x FP16) et en 128 bits (4x FP32). Nous avons ajouté pour information les performances en 32 bits RGB9E5, un nouveau format HDR introduit par DirectX 10 qui permet de stocker des textures HDR en 32 bits avec quelques compromis. Ces tests ont été réalisés avec un outil fourni par nos confrères et amis de Beyond 3D .


Tout d'abord, en filtrage bilinéaire, vous remarquerez la différence évidente entre la GeForce 8800 Ultra et la GeForce 9800 GTX capable de filtrer les textures 32 bits 2x plus rapidement grâce à la présence de plus d'unités d'adressage. La GeForce GTX 280 est nettement devant la GeForce 9800 GTX alors qui si nous regardons les débits théoriques, ils sont très proches avec respectivement 43.2 GTexels/s et 48.2 GTexels/s. Autrement dit, Nvidia a bel et bien amélioré le rendement de ses unités de texturing puisque nous passons d'un rendement de 78% à 98%. Pas mal.


Ensuite, nous passons au filtrage trilinéaire avec ce second tableau. Ici, le doublement des unités d'adressage des textures n'est d'aucune utilité, et le rendement était déjà très bon, du coup les performances sont sans surprise. Notez que le test n'a pas donné de résultats corrects sur la Radeon HD 3870, mais ses débits sont censés être +/- divisés par 2 par rapport aux débits en filtrage bilinéaire.


Performances des ROPs
Le GeForce GTX 280 dispose de 32 ROPs, contre 24 pour le GeForce 8800 Ultra et 16 pour le GeForce 9800 GTX. Pour rappel les ROPs sont les unités chargées des derniers traitements à effectuer sur les pixels (mélange des couleurs, antialiasing, compression des données et écriture de celles-ci en mémoire). La taille du bus mémoire est en partie liée à cette augmentation.

Pour rappel, non content d’en avoir augmenté le nombre, Nvidia en a amélioré l’efficacité sur GeForce 8 lors des passes qui n’écrivent que la valeur Z en mémoire. AMD est très loin en terme de débit à ce niveau :


Les GeForce sont ici très véloces, nettement plus que la Radeon HD 3870, tout du moins jusqu'en antialiasing 4x. En mode 8x, la Radeon HD 3870 conserve un débit similaire alors qu'il se réduit sur les GeForce, probablement par manque de bande passante mémoire. Le bus 512 bits de la GeForce GTX 280 lui permet cependant de rester devant.

Nous avons ensuite, ici aussi à l'aide d'un outil fourni par nos confrères de Beyond 3D , testé le débit des ROPs quand ils écrivent des pixels en mémoire, d'une manière classique tout d'abord et ensuite avec mélange des couleurs (blending), notamment utilisé pour les effets de transparence.


A l'exception d'un débit plus bas que prévu sur le GeForce GTX 280 en FP32x1, les résultats sont logiques et collent au nombre de ROPs. Le 64 bits est 2x plus lent que le 32 bits et le 128 bits encore 2x plus lent. Quant au 32 bits "FP10", il est géré de la même manière que le FP16 et donc ne profite malheureusement pas d'un débit plus élevé.


Une fois le blending utilisé, nous pouvons constater un net gain pour la GeForce GTX 280 qui profite d'une implémentation à pleine vitesse de cette fonction.
Vos réactions

Top articles