Guillemot 3D Prophet & GeForce 256 Cartes Graphiques Publié le Mardi 12 Octobre 1999 par Marc Prieur URL: /articles/41-1/guillemot-3d-prophet-geforce-256.html Page 1 - Introduction
Il existe deux versions de la 3D Prophet, la version standard ainsi que la version DDR, annoncée il y´a peu. Seule différence ? la mémoire vidéo. En effet, alors que la 3D Prophet est équipée de 32 Mo de SDRAM à 166 Mhz, la 3D Prophet DDR utilise une RAM de dernière génération, la DDR, qui offre à fréquence égale le double de bande passante. Avantage direct ? De meilleures performances, notamment en hautes résolutions et en mode 32 bits. Pour ma part, j´ai pu tester la version SDRAM de la 3D Prophet.
Guillemot nous offre avec la 3D Prophet une carte à base de GeForce 256 sans surprise … mais le fait qu´elle soit équipée d´un GeForce 256 suffit à la rendre très intéressante. Page 2 - Le nVidia GeForce 256
Pour ce faire, les ingénieurs de chez nVidia ont imaginé un chip graphique doté de pas moins de 23 Millions de transistors. Malheureusement, le chip n´est gravé qu´en technologie 0.22 Microns, TSMC, qui fabrique les chips pour nVidia, n´étant pas encore vraiment prêt pour le 0.18. Le GeForce 256 n´est donc cadencé qu´a 120 Mhz … mais est ce dramatique ? Pas du tout ! En effet, l´architecture même du GeForce 256 fait que même à 120 Mhz, il explose tout ce qui se fait actuellement en 3D. Mais … n´allons pas si vite et intéressons nous tout d´abord à la partie 2D et Vidéo du chip. Pour ce qui est de la 2D, pas grand chose à dire. Le moteur 256 bits offre sur le papier des performances de très haut niveau, qui ne seront pas gâché par le RAMDAC 350 Mhz qui permet d´atteindre le 2048*1536 à 60 Hz … et d´atteindre les 85 Hz en 1920*1200. Pour ce qui est de la vidéo, c´est plutôt pas mal, puisque contrairement a leurs habitudes les ingénieurs de nVidia ont pensé sérieusement au MPEG-2. Ainsi, le chip supporte le motion compensation, ce qui correspond à une accélération semi matérielle. Coté 3D, le GeForce 256 se distingue tout d´abord par la présence de 4 unités de calculs indépendantes, chacune intervenant l´une après l´autre dans la création de la scène 3D :
Si le Rendering Engine est présent sur toutes les cartes graphiques dites 3D et le Setup Engine est intégré sur les cartes 3d depuis le 3dfx Voodoo 1, c´est nettement différent pour le Transform et le Lighting Engine. Le GeForce 256 est en effet le premier chip grand public à les intégrer, et ce de la plus belle manière qu´il soit. D´une part, il ne s´agit pas d´un co processeur externe mais interne au GeForce 256, ce qui réduit les coûts, et d´autre part ce n´est pas une seule unité qui gère le Transformation & Lighting, mais une unité qui gère le Transform et une autre le Lighting. Nous nous intéresserons un peu plus loin à l´apport du Transform & Lighting … pour nous intéresser tout d´abord à ce qu´il y´a de plus classique dans la partie 3D du GeForce 256, je parle bien sur du Rendering Engine. Pour faire simple, on peut dire que nVidia à en fait intégré deux rendering engine de TNT 2 dans le GeForce 256. Ce dernier dispose donc de 4 Pixel Pipeline, ce qui correspond à une fréquence de 120 Mhz à un fillrate théorique de 480 Mpixel /s (contre 300 pour un TNT 2 Ultra). Chacun de ces Pipeline dispose d´un Texel Engine. Le GeForce 256 est donc capable de rendre 4 Pixels en single texturing ou 2 Pixel en dual texturing ou 1 Pixel en quad texturing par cycle d´horloge, et ce que ce soit en bilinear ou trilinear filtering : en effet, chacun des Texels Engine peut lire 8 Texels par cycle d´horloge, ce qui leur permet d´effectuer le trilinear filtering sans pertes de performance au niveau du rendering engine, contrairement au TNT 2 et comme le Savage4 (par exemple). Page 3 - Transformation & Lighting
Mais avant tout, la transformation, à quoi ca sert ? En fait c´est très simple. Une scène 3D est composée de différents objets qui sont composés de différents polygones, qui sont composés de vertex (ouf !). Pour créer une animation, on calcule diverses images intermédiaires, chacune étant un peu différente de l´autre, et il suffit ensuite de visualiser ces images à une vitesse suffisante pour avoir une animation et une impression de mouvement fluide. Les changements qui interviennent entre chaque image sont issus de calculs mathématiques influant sur la position des vertex, c´est la transformation. Il existe plusieurs types de transformations, pouvant bien sur être combinées :
Jusqu´alors, dans nos pauvres PC, c´etait le processeur qui se chargeait d´appliquer les différentes matrices de transformations aux vecteurs formant les polygones afin d´obtenir un placement des objets 3D tel qu´on le désire. Avec un chip tel que le GeForce 256, on peut décharger le processeur de cette tache de transformation … ainsi que de la gestion des éclairages dynamiques, peu utilisé jusqu´alors du fait de sa gourmandise en calcul. Deux avantages : d´une part l´unité dédiée à la transformation et l´unité dédiée au lighting se trouvant au cœur du processeur graphique ne font que ca, et disposent donc de fonctions pré câblées à cet usage. Le processeur est quand à lui polyvalent, mais moins rapide pour l´exécution de taches précises. Ainsi, le co processeur géométrique du GeForce 256 a une puissance brute de 15 Millions de triangles par seconde, contre … 4 Millions pour un Pentium III 550 ! Les applications 3D devraient donc tourner plus vite, et les objets plus détaillés car dotés de plus de faces. De plus, la prise en charge du T&L par un GPU tel que le GeForce 256permet de libérer pas mal de puissance processeur (jusqu´a 20-25% dans les jeux actuels), qui pourra être utilisée pour autre chose. Je pense bien sur à l´intelligence artificielle des jeux, au moteur physique ou encore au gameplay. Malheureusement, toutes les applications 3D ne peuvent pas tirer partie d´office du Transformation & Lighting. En OpenGL, pas de problème. Cette fonction étant géré depuis la première version d´OpenGL, toutes les applications sont faites pour en tirer partie. Ainsi, il suffit que le driver OpenGL ICD de la carte graphique utilise le GPU et non le CPU pour faire les calculs de T&L pour que ce soit fait, et c´est bien sur ce que fait le driver du GeForce 256. En théorie donc, tout jeu utilisant un moteur OpenGL pourra tirer parti d´un GPU tel que le GeForce 256, et ce dès à présent. C´est notamment le cas des jeux basés sur les moteurs d´ID Software (QuakeGL, Quake II, Quake III, Half Life, KingPin pour ne citer que les plus connus). Dernier problème, même si un jeu exploite le T&L … encore faut-il qu´il dispose de scènes assez complexes pour vraiment en tirer un avantage ! Pour ce qui est de Direct3D, c´est bien différent. En effet, le T&L n´est géré que depuis la 7ème version de DirectX, sortie il y´a peu. Dès Noël, certains jeux DirectX 7 utiliseront le T&L. C´est notamment le cas de Midnight GT de Rage Software, qui sont connus pour exploiter dès leur sortie les dernières technologies 3D. Il faudra donc se rabattre sur OpenGL en attendant que des jeux Direct3D tirent partie du T&L, ou que des patchs sortent pour des jeux existants. Page 4 - AGP 4x FW, DirectX TC,Cube Env. Map
Si le GeForce 256 n´est pas le premier chip a supporter l´AGP 4x, c´est le premier à le supporter pleinement. En effet, le GeForce 256 gère le mode Fast Write. What ? Il s´agit en fait d´une nouvelle fonction introduite avec l´AGP 4x. Le Fast Write permet en fait au processeur d´envoyer des données directement au processeur graphique via le bus AGP, et ce sans passer par la mémoire vive comme c´etait le cas auparavant. D´une part, ca va plus vite, et d´autre part la mémoire peut vaquer à d´autres occupations. Toutefois, je dois bien avouer qu´il m´est impossible de tester cette fonction pour le moment... En effet la seule carte mère i820 que j´ai ici demande de la RAMBUS, mémoire introuvable en France.
Niveau fonctions 3D, le GeForce 256 est le plus complet à l´heure actuelle. Tout d´abord, toutes les fonctions prises en charge par le TNT 2 sont prises en charge par le GeForce. Je pense bien sur au Z-Buffer 24 bits, au Stencil Buffer 8 bits, aux couleurs 32 bits, au bilinear / trilinear / anisotropic filtering, à l´emboss bump mapping, aux textures de 2048*2048 pixels ou tout simplement au single pass multitexturing. Mais en plus de ca, le GeForce 256 intègre le DXTC ainsi que de nouvelles fonctions DirectX 7 (en plus du T&L bien entendu).
La technologie de compression S3TC est libre d´utilisation sous DirectX, ce dernier l´intégrant depuis sa version 6. L´implémentation du S3TC est appelée DirectX Texture compression, et est gérée par le GeForce 256 en hardware. Le DXTC est en fait un algorithme de compression de texture puissant, qui permet d´atteindre un taux de compression de 6:1 sans perte notable de qualité. Les textures DXTC ont l´avantage de prendre moins de place sur le media en lui même (disque dur, cd rom …), mais aussi en mémoire vidéo ou en mémoire centrale. De plus, elle seront transférées plus vite à la carte graphique via le bus AGP. Bref, une excellente fonction … qui ne demande qu´a être exploitée.
Le GeForce 256 supporte le Cube Environment Mapping, alors que les chips actuels utilisent Sphere Environment Mapping. Le Cube Environment Mapping offre deux avantages sur le Sphere Environment Mapping. D´une part, avec le Sphere Enviroment Mapping, la texture d´environment map est sphérique, et il en résulte des problèmes lorsqu´on l´applique sur un objet 3D (une image étirée ou déformée par endroit, surtout à l´arrière d´un objet). Avec le Cube Environment Mapping, la texture d´environment map est cette fois ci cubique, ce qui permet d´éviter les problèmes de qualité rencontrés avec le Sphere Environment Mapping. De plus, avec le Cube Environment, l´environment map interagit en permanence avec la scène 3D … ainsi dans un jeu de voiture, si un adversaire vous double sur la droite, vous le verrez se réfléchir sur votre carrosserie.
Le Vertex Blending est une technique permettant, grâce à l´utilisation du Transformation & Lighting, d´effectuer des jointures lisses entre les différentes parties d´un objets 3D. A gauche, sans Vertex Blending … et à droite avec. Page 5 - Config. de test, Compatibilité, Stabilité
Voici le système sur lequel tout les tests ont été effectué :
Cartes utilisées :
Drivers utilisés :
Point de vue qualité d´image, rien à dire en 3D. Trilinear filtering d´excellente qualité, Le trilinear filtering est très bon, bien au dessus de celui offert par un TNT 2, et le mode 16 bits est toujours d´aussi bonne qualité. Le RAMDAC s´avère de bonne qualité et l´image est plutôt bonne en 1600*1200. La compatibilité hardware s´avère correcte, mais il faut disposer tout de même d´une bonne carte mère à base de chipset BX ou AMD 751 pour ne pas avoir de problèmes de voltage au niveau de l´AGP. En effet une carte telle que la 3D Prophet consomme autant qu´une Xentor 32, et la Xentor32 avait justement posé problèmes sur beaucoup de cartes mères LX, de cartes mères Super 7, sans oublier quelques BX "bas de gamme". Sinon, je dois bien avouer que j´ai subit quelques plantages du fait des drivers bêtas, surtout en Direct3D. En OpenGL, impossible de lancer le ProCDRS-02 dans le Viewperf 6.1.1 ou le benchmark 3D Exercizer. A noter qu´en OpenGL toujours, Half Life avait des problèmes de texturing (quelques d´objets non texturés), mais il s´agissait de la version de base non patchée … Les applications Direct 3D ne se sont pour leur part avérées vraiment stable qu´avec les drivers 2.08, c´est pourquoi j´ai fait les tests avec ces drivers sous Expendable et Dethkarz. Niveau overclocking, la 3D Prophet que j´ai pu tester tournait sans trop de problèmes à 135 Mhz pour le core et 175 Mhz pour la mémoire, pas mal ! Voilà donc quelques points qu´il faudra vérifier avec la version finale des drivers et de la carte.
Rien à dire sur les performances 2D, qui sont légèrement inférieures à celles du TNT 2 Ultra. Page 6 - Performances Direct3D
Benchs effectués avec les drivers nVidia 2.08. Pas de 1600*1200 32 bits de disponible dans Expendable, d´où les benchs en 1600*900.
Comme vous pouvez le voir, les jeux DirectX actuels ne tirent pas vraiment partie du GeForce 256. Seule la résolution 1600*1200 16 bits (ou 1600*900) permet a ce chip de prendre une bonne longueur d´avance sur un bon vieux TNT 2 Ultra. Page 7 - Performances OpenGL - Q2
Sous ce bon vieux Quake II, les gains sont non négligeables et ce même en basse résolution, puisque l´on gagne 25-30%, grâce au Transformation & Lighting principalement. Lorsque l´´on monte en résolution, l´écart se creuse pour atteindre son maximum en 1600*1200 16 bits. Dans cette résolution, le passage d´un TNT 2 Ultra à un GeForce 256 apporte un gain de 80% en performances. A noter que sous demo1, un Celeron 300 + GeForce est plus rapide qu´un PIII 500 + TNT 2 Ultra dès le 1024*768 16 bits. Sous crusher, qui met plus a parti processeur central et le transformation engine, l´équilibre se fait plutôt au 1024*768 32 bits, et c´est ensuite que le Celeron 300 + GeForce est au dessus d´un PIII 500 + TNT 2. Page 8 - Performances OpenGL Quake III
Dès le 640*480, le GeForce 256 montre sa puissance et permet à ce pauvre Celeron 300 de se rapprocher du score obtenu par un couple Pentium III 500 + TNT2 Ultra. Néanmoins le processeur est toujours un point important, puisque c´est couplé à un Pentium III 500 que le GeForce 256 explose tout les scores, excepté une fois encore en 1600*1200 32 bits ou il s´avère très proche du TNT2. J´ai ensuite essayé la même demo1 dans Quake III, mais avec des réglages 3D qui permettent d´augmenter le nombre de polygones, à savoir :
A ma grande surprise, j´ai pu voir que cela avait un impact important sur les performances de la machine. Que ce soit avec une TNT 2 Ultra ou une GeForce 256, la perte de performance s´élève à 25-30% Le coprocesseur géométrique, s´il relativise la puissance du processeur, ne le met donc pas complètement de coté, ce dernier s´occupant toujours de toute la gestion de la scène. Voici quelques benchmarks effectués sous Quake III en 1600*1200, sur un Celeron 300. La première valeur correspond au nombre de Couleurs (16 ou 32 bits, et donc Z-Buffer 16 ou 24 bits par la même occasion), la seconde aux Textures (16 ou 32 bits) et la dernière … et bien il s´agit du filtrage utilisé, bilinear ou trilinear filtering. Comme vous pouvez le constater, le passage en frame buffer 32 bits et en Z-Buffer 24 bits fait chuter les performances du GeForce 256 à 3.5 images / s de celles du TNT 2 Ultra, alors que l´écart atteignait les 13.7 images secondes en 1600*1200 16 bits, textures 16 bits et bilinear filtering. Pourquoi une telle chute de performance ? Tout simplement un manque de bande passante mémoire. Le GeForce 256 dispose de 32 Mo de SDRAM 128 Bits à 166 Mhz, alors que ce sont 32 Mo de SDRAM 128 Bits à 183 Mhz qui équipent les TNT 2 Ultra. Cette bande passante limitée en mémoire vidéo explique les mauvaises performances du GeForce 256 en 1600*1200 32 bits, et ce dans tout les benchs effectués jusqu´à présent. Page 9 - Performances du T&L
Le Treemark est un benchmark crée par nVidia, dont le but est de mettre en avant les performances exceptionnelles du T&L du GeForce 256. Comme vous pouvez le voir, c´est plutôt réussi ! A noter que le passage de 1 à 8 lumières géométriques fait baisser le framerate de 40% avec le GeForce 256 … et de 66% sur PIII 500 & TNT 2. Comme vous pouvez le voir, que le processeur soit un Celeron 300 ou un Pentium III 500, les performances sont identiques … mais est ce vrai dans tout les cas ? Et bien non, comme vous pouvez le voir, avec un Depth = 8 (128080 triangles)et une seule lumière dynamique, le GeForce se retrouve limité à 17 images /s, alors qu´il atteint les 26.4 images /secondes sur Pentium III 500. La encore donc, le GPU ne fait malheureusement pas tout ! Encore deux benchs utilisant le T&L. Le Boxter Mark est comme le TreeMark d´origine nVidia, et utilise comme ce dernier l´OpenGL. On fait plus que quadrupler les performances sur Celeron 300, et on les doubles presque sur Pentium III 500. The Whole Experience, c´est un moteur de jeu DirectX7, qui sera utilisé dans un jeu prévu pour la mi 2000. Le gain de performance est encore une fois significatif, puisque l´on gagne 140% sur Celeron 300 et 55% sur Pentium III 500. Page 10 - Performances OpenGL Pro
Viewperf, c´est en fait le bench de référence en OpenGL. Développé par Spec, ce bench est découpé en 5 parties distinctes, toutes représentatives d´une application :
Les gains de performances sont très important, et font a priori du GeForce 256 un excellent chip pour l´OpenGL Pro. Toutefois, il est regrettable que l´indice ProCDRS plante au démarrage. J´ai ensuite effectué quelques tests sous 3D Studio Max 3, grâces aux animations fournies avec le logiciel dans le repertoire scenesenchmark. Je dois avouer que je suis déçu par les performances dans les scènes geom1.max et geom2.max, extremement lourdes en polygones : je m´attendait a un gain supérieur au 35% obtenus. A noter l´excellent résultat sur light1.max, scène utilisant 8 lumières dynamiques. Page 11 - Screenshots T&L
Page 12 - Conclusion
Rendez vous dans quelques semaines (la carte devrait être disponible à la fin du mois) pour le test de la version finale retail de la Guillemot 3D Prophet. Copyright © 1997-2025 HardWare.fr. Tous droits réservés. |