ATI Radeon HD 2900 XT

Publié le 15/05/2007 par
Imprimer
Ring bus 2.0
Dans son implémentation "carte graphique", pour le R600, l’architecture a vu son sous-système mémoire complètement revu pour (il est basé sur une puce eDRAM sur console) et similaire à celui des Radeon X1000. Le ring bus est donc toujours d'actualité. Plus encore même puisqu'il est maintenant utilisé dans les 2 sens : pour l'envoi et pour la réception des données alors qu'il ne l'était que pour la réception. L'intérêt principal d'un ring bus est de faciliter le design de la puce et d'éviter d'avoir un câblage trop dense au cœur du GPU ce qui peut finir par poser de nombreux problèmes. En ce qui concerne le Radeon HD 2900, le ring bus est de 512 bits dans les 2 sens, soit 1024 au total. Notez que les sens de circulation sur le ring bus ne sont pas liés à l'envoi/réception, mais utilisé pour que ceux-ci puissent atteindre leur destination via le chemin le plus court.


Vous l'aurez par ailleurs compris, ce ring bus se connecte à un bus mémoire 512 bits ce qui est une première et permet à AMD de ne pas devoir utiliser de la mémoire très rapide et donc très chère pour obtenir une bande passante élevée.

Autre nouveauté, l'intégration d'un contrôleur d'accès supplémentaires et autonome pour le bus PCI Express. De qui permettre d'éviter que le GPU ne soit bloqué pendant les transferts PCI Express comme c'est le cas actuellement. Une avancée très importante, pour la communication entre le CPU et le GPU, pourquoi pas sur la plateforme Torrenza d'AMD ?
Unités de texturing
Le bloc d'unités de texturing n'a malheureusement pas été élargit. Il reste donc identique à celui du GPU de la Xbox 360 et contient 16 samplers vec4 raccordés à une unité de filtrage bilinéaire (ce qui correspond à 16 unités de texturing classiques) et 16 samplers scalaires sans filtrage.


Pour sa part le GeForce 8800 dispose de 32 samplers vec4 raccordés à 2 unités de filtrage bilinéaire. L'avantage est énorme en puissance de filtrage pour le GPU de Nvidia. 16 unités c'est peu, trop peu ? AMD indique avoir optimisé leur rendement mais également que les 16 samplers scalaires permettent de décharger les unités classiques de certaines opérations. Pour notre part, avant même avoir commencé les tests cela nous paraît malgré tout trop faible, surtout pour une carte haut de gamme qui sera en général utilisée avec des filtrages anisotropes qui peuvent monopoliser les unités de filtrage pendant de nombreux cycles.

Contrairement aux Radeon X1000, ces unités de filtrages prennent maintenant en charge nativement et à pleine vitesse le filtrage FP16 des textures 64 bits HDR. Le filtrage FP32 est lui aussi supporté mais à demi-vitesse, comme sur GeForce 8. AMD indique que le bus mémoire 512 bits aide à maximiser l'efficacité de ces unités lors de traitement des textures de haute précision gourmandes en bande passante mémoire, ce qui permet ici aussi de compenser en partie le déficit de puissance brute par rapport aux GeForce 8.

La structure du texture cache a été revue pour inclure un cache L1 de 32 Ko localisé par group de 4 unités et un gros cache L2 de 256 Ko.

Enfin, dernier petit détail : chez Nvidia un groupe de 4 unités de texturing est attribué d'une manière fixe à 2 groupes de 8 processeurs scalaires. Chez AMD ce n'est pas le cas et toutes les unités de texturing peuvent être attribuées à un même groupe de 16 unités MIMD. Cela compense quelque peu la différence dans certains cas. Reste qu'en général lorsque la puissance de texturing joue un rôle important, plus ou moins toutes les unités de traitement en ont besoin.
Vos réactions

Top articles