Radeon HD 4670 et GeForce 9500 GT

Publié le 10/09/2008 par
Imprimer
Les spécifications en détail
Nvidia et AMD ont opté pour 2 voies très différentes en terme d'architecture. Nvidia se base sur des unités de calcul scalaires, plus efficaces, et cadencées à une fréquence double par rapport à leur logique de gestion. De son côté AMD exploite des unités de calcul vectorielles 5D, moins efficaces mais dont le coût relatif à la puissance de calcul est nettement plus réduit.

La différence d'efficacité vient du fait qu'avec les unités scalaires, l'utilisation optimale est automatique et naturelle alors qu'avec des unités vectorielles, il revient au compilateur et au scheduler d'essayer de les exploiter au mieux. Ce rappel étant fait, passons aux spécifications.


Avec le RV730 de la Radeon HD 4670, AMD offre 64 unités vec5 face aux 32 unités scalaires du G96 de la GeForce 9500 GT. Du côté de Nvidia les unités de calcul fonctionnent à une vitesse double. Pour simplifier nous pouvons donc dire que c'est comme si nous avions chez Nvidia 64 unités scalaires contre 64 unités vec5 chez AMD. Si des unités scalaires sont préférables pour l'efficacité, lorsque les unités vectorielles sont présentes en un même nombre, elles ont bien entendu l'avantage. Dans le pire des cas elles feront aussi bien que les unités scalaires, la possibilité de vectorisation (jusqu'à x5) étant ici 100% bonus pour la Radeon HD 4670 face à la GeForce 9500 GT.


Par rapport au RV770 des Radeon HD 4800 qui dispose de 160 unités vec5, l'organisation interne est différente. Dans le RV770 les unités de calcul sont organisées en 10 clusters de 16 et chaque cluster dispose d'un bloc de 4 unités de texturing et de filtrage. Pour le RV730, AMD a réduit le nombre de cluster de 10 à 8 et le nombre d'unités de calcul vec5 par cluster de 16 à 8. 8x8 = 64, le compte est bon. 4 unités de texturing restent présentes par cluster ce qui fait que la puissance de texturing est très proche entre le RV770 et le RV730. Par contre ce dernier ne dispose que de 16 interpolateurs, ce qui limite l'utilisation des 32 unités de texturing dans certains cas. Petit détail intéressant, le fait que les unités de calcul soient groupées par plus petit nombre améliore les performances lors des branchements puisque les groupes de données à traiter sont plus petits. Ils passent de 64 éléments à 32 éléments et la probabilité que ces éléments empruntent une même branche augmente d'une manière logique.

AMD profite de l'utilisation du procédé de fabrication 55 nanomètres pour placer toutes ces unités dans sa puce sans qu'elle ne soit trop grosse. Le RV730 se contente ainsi de 144 mm² contre 121 mm² pour le G96. Il est un peu plus gros mais contient une puissance de calcul nettement supérieure.

Le bus mémoire est similaire des 2 côtés, par contre AMD innove en introduisant le support de la mémoire DDR3 en plus de celui de la GDDR3. Un détail anodin au premier abord mais pourtant très important puisqu'il permet à AMD d'utiliser de la mémoire classique (la même que sur les barrettes mémoire DDR3), produite en grand volume et donc moins chère que la mémoire graphique.

Si AMD a simplifié son architecture, le fabricant conserve malgré tout le support de DirectX 10.1 et son unité de tesselation dont la version DirectX 11 en sera un superset. De quoi peut être enfin convaincre les développeurs de l'utiliser puisque leur travail fait sur les Radeon HD 2000, 3000 et 4000 sera très facilement compatible avec toutes les cartes DirectX 11.


La GeForce 9600 GSO offre, elle, 96 unités de calcul scalaires, soit 3x plus que la GeForce 9500 GT et un bus mémoire de 192 bits. Malheureusement cela est obtenu sur base d'un GPU G92 (plus de 2x plus gros que le RV730 avec 324 mm²) qui contient 128 unités et un bus mémoire 256 bits. Cette puce fortement castrée est donc déséquilibrée et il est difficile de prévoir ses performances sur base de ses spécifications. La GeForce 9600 GT aurait pu être un bon concurrent pour la Radeon HD 4670 mais elle est dans le segment supérieur, malgré ses baisses de prix successives.

Terminons sur les spécifications en mentionnant l'existence de variantes de certaines cartes testées ici. Malheureusement, tant AMD que Nvidia s'entêtent à ne pas vouloir arrêter d'essayer de tromper le consommateur via des produits différents mais au nom identique :


La Radeon HD 4670 disposera d'une petite sœur équipée de mémoire DDR3 au lieu de la GDDR3. Il n'y aurait pas de critique à faire si la fréquence mémoire n'était pas revue de 1000 MHz à 900 MHz… Notez qu'il sera intéressant de tester une telle variante dès qu'elle sera disponible pour observer la différence de performances entre la DDR3 et la GDDR3 à fréquence égale.

La Radeon HD 3850 est disponible chez certains fabricants avec un bus mémoire qui passe de 256 à 128 bits ! Soit une bande passante divisée par 2. Mais le produit porte le même nom…

Enfin chez Nvidia la GeForce 9500 GT existe en version GDDR3 à 800 MHz (mais de nombreux fabricants utilisent de la mémoire à 700 MHz!) et en version DDR2 à 500 MHz. Toutes s'appellent GeForce 9500 GT. Attention donc à ces sous-produits !
Vos réactions

Top articles