Nvidia CUDA : plus en pratique
Publié le 09/08/2007 par Damien Triolet
CPU ScalingLe logiciel est prévu pour scaler presque parfaitement mais d'après nos résultats ce ne serait pas le cas avec les CPUs. Etrange. Nous avons décidé de tester le QX6850 avec 1, 2 et 4 cores pour observer ce qui se passe :
Entre 1 et 2 cores, les performances scalent très bien puisque les performances augmentent de 93%. Par contre en passant de 2 à 4 cores, le gain n'est que de 39% et pourtant tous les 4 cores tournent à plein régime. Que se passe-t-il ? A ce moment nous nous rappelons que chaque GPU ajouté dispose de sa propre mémoire et donc de sa propre bande passante alors que les cores CPUs ajoutés doivent se partager une même bande passante mémoire.
Afin de vérifier que ces gains limités sont bien dus à une insuffisance de bande passante mémoire, nous avons réalisé un test supplémentaire, cette fois sur la plateforme V8 en retirant des modules mémoire de manière à tester les performances avec 1, 2 et 4 canaux FB-DIMM soit avec 5.33, 10.66 et 21.33 Go/s de bande passante mémoire. Il s'agit de modules de 1 Go or la consommation mémoire totale du système ne dépasse pas les 900 Mo quand le test tourne, nous ne sommes donc pas limités par la présence de seulement 1 Go.
La bande passante mémoire a bien une influence conséquente sur les performances et est donc un facteur limitant, surtout sur les CPUs multicores dont les cores doivent se la partager.
ConsommationNous avons mesuré à la prise la consommation des systèmes en charge avec une alimentation Enermax Galaxy 850 Watts :
Les 3 GeForce 8800 affichent plus de 700 Watts au compteur ! Notez que un core CPU est utilisé par GPU et donc que la différence entre 2 et 3 cartes par exemple ne consiste pas uniquement en la consommation d'une 8800 mais bien d'une 8800 + d'un core CPU au travail.
Si la différence entre le QX6850 et le E6850 est faible, c'est parce que le QX6850 passe beaucoup de temps à attendre de récupérer des données de la mémoire.
Une fois que nous mettons la consommation en relation avec les performances, nous pouvons constater un net avantages dû à l'utilisation des GPUs. Plus le ratio puissance GPU / puissance CPU est élevé, plus le rendement par watt augmente. Tout du moins sur la plage de données testée puisqu'il est évident que ce rendement ne continuera pas d'augmenter à partir du moment où le/les CPUs ne seront plus capables d'alimenter correctement les GPUs.
VMD : le test 1/2
Conclusion
Sommaire
Vos réactions
Contenus relatifs
- [+] 09/02: Nvidia lance les Quadro Pascal dont...
- [+] 05/04: GTC: Nvidia Tesla P100: 10 Tflops, ...
- [+] 15/12: GPUOpen, la réponse d'AMD à GameWor...
- [+] 16/11: AMD et HPC: nouveaux outils, suppor...
- [+] 09/07: AMD lance la FirePro S9170: Hawaii ...
- [+] 08/12: Nvidia lance la Tesla K80: double G...
- [+] 02/12: IBM Power9 et Nvidia Volta : 100+ p...
- [+] 25/11: Nvidia annonce la Tesla K40 et CUDA...
- [+] 13/11: APU13: HSA: nouveaux membres, Oracl...
- [+] 06/05: AMD hUMA: la mémoire unifiée trouve...