Les derniers contenus liés au tag AMD

Afficher sous forme de : Titre | Flux Filtrer avec un second tag : AMD A-Series; AMD FX; APU; Catalyst; GCN; Llano; Nvidia; Radeon; Radeon HD 6000; Radeon HD 7000;

GDC: AMD mise sur la VR, annonce LiquidVR

Tags : AMD; GDC; GDC 2015; VR;
Publié le 04/03/2015 à 01:43 par Damien Triolet

AMD profite de la GDC pour rejoindre le mouvement d'engouement actuel autour de la réalité virtuelle (VR), en annonçant un SDK dédié : LiquidVR.


Proposer un rendu satisfaisant à travers les casques de réalité virtuelle représente un challenge, mais également une opportunité de se démarquer et potentiellement de nouveaux marchés pour les fabricants de processeurs graphiques tant la puissance demandée peut être élevée. Si elle est insuffisante, le résultat est rapidement catastrophique. Nvidia a annoncé travailler dans ce sens il y a quelques mois et c'est aujourd'hui au tour d'AMD de présenter son initiative.


L'objectif à très long terme est qualifié de "Full Presence" et correspond en quelque sorte aux réalités virtuelles les plus avancées que vous avez pu apercevoir dans les films de science-fiction. AMD estime qu'il faudra multiplier par un million les capacités actuelles pour y parvenir, ce n'est pas encore pour aujourd'hui.

A plus court terme, AMD a voulu essayer d'identifier les challenges actuels auxquels il était possible d'apporter une réponse dès aujourd'hui de manière à améliorer le confort, la compatibilité et le contenu. Grossièrement, cela revient à optimiser le time warping, à assurer un pilotage direct des casques de réalité virtuelle et à proposer un mode multi-GPU dédié.


Pour cela, le SDK LiquidVR 1.0, propose 4 fonctionnalités, dont les deux premières sont liées au time warping. Cette technique consiste pour rappel à réduire la latence en prenant en compte les informations des capteurs de mouvements après avoir débuté, voire terminé, le calcul de l'image. Ces informations plus récentes sont exploitées pour déformer la dernière image calculée de manière à émuler ce que nous aurions vu si l'image pouvait être calculée instantanément juste avant l'affichage.

Ces deux fonctionnalités proposées par AMD à ce niveau sont dénommées Latest Data Latch et Asynchronous Shaders. La première fait en sorte que le GPU puisse avoir un accès facilité aux dernières données de position, mise à jour constamment en parallèle par le CPU.


La seconde exploite une caractéristique des GPU de la génération GCN : les ACE pour Asynchronous Compute Engines. Il s'agit de processeurs de commandes secondaires qui peuvent lancer des tâches de type compute sur le GPU de manière transparente, en même temps que celui-ci est en train de traiter des commandes graphiques. Ce traitement en parallèle permet de réduire la latence en lançant l'opération de time warping avant que l'image finale ne soit totalement terminée mais également de débuter l'affichage de l'image avant que le time warping ne soit terminé sur toute l'image.

De quoi économiser quelques ms au niveau de la latence et surtout de quoi éviter toute saccade si le time warping et le calcul de l'image dépassent le délai imposé par le rafraichissement. Si le calcul de la nouvelle image prend trop de temps, le time warping, qui est traité en parallèle via les ACE, pourra appliquer de façon transparente les dernières données de position sur l'image précédente. Cela reste préférable de disposer de la dernière image et des dernières informations de positions bien entendu, et les Asynchronous Shaders permettent d'ailleurs de faire en sorte que ce soit plus souvent le cas, mais quand ce n'est pas possible, éviter un ralentissement est primordial.


Ensuite, le mode Affinity Multi-GPU permet de profiter de plusieurs GPU sans augmenter la latence et en réduisant le coût CPU globale. Le mode AFR classique est inadapté parce qu'il introduit trop de latence supplémentaire, raison pour laquelle le multi-GPU classique a rapidement été mis de côté, malgré les besoins de puissance de calcul qui dépassent bien souvent ce dont est capable un seul GPU. En mode Affinity, chaque GPU peut être assigné à un œil, mais sans calculer des images successives. Ils vont calculer la même image en même temps, simplement d'un point de vue différent. C'est assez logique en fait, mais encore fallait-il qu'AMD l'implémente.

Enfin, le Direct-to-Display permet aux pilotes AMD de directement gérer l'affichage sur tous les casques de réalité virtuelle, sans passer par un SDK tiers tels que celui d'Oculus. Les pilotes Catalyst vont reconnaître les casques, les considérer comme des écrans secondaires spécifiques et adapter le mode d'affichage à cet effet. De quoi simplifier nettement la configuration et améliorer la stabilité, tout du moins si les pilotes proposés par AMD s'avèrent ne pas souffrir de bug. A noter qu'Oculus, présent à la session d'AMD, a précisé avoir collaboré au développement de Direct-to-Display.

AMD proposait évidemment une démonstration de LiquidVR, basées sur un Oculus Rift Crescent Bay et l'animation Showdown, avec un excellent résultat. Difficile cependant sans comparer d'autres solutions côte-à-côte d'affirmer que LiquidVR apporte un avantage significatif. Lorsque nous avions testé cette même démo lors d'un évènement Nvidia en septembre dernier, le résultat était également très bon.

A noter que le système utilisé par AMD ne faisait pas appel au multi-GPU mais bien à une carte graphique basé sur un nouveau GPU. En d'autres termes, il s'agissait d'une Radeon R9 390X et du GPU Fidji.

Le SDK LiquidVR 1.0 et ses spécifications sont actuellement distribués par AMD au cas par cas aux différents acteurs engagés dans le développement de la réalité virtuelle.

 
 

AMD lève le voile sur Carrizo côté technique

Tags : AMD; Carrizo; Carrizo-L; Zen;
Publié le 24/02/2015 à 01:45 par Marc Prieur

AMD dévoile de nombreux détails sur son APU Carrizo à l'occasion de l'ISSCC 2015, une conférence annuelle dédiée aux circuits intégrés se déroulant à San Francisco cette semaine. Pour rappel, les grandes lignes des informations dévoilées ici avaient déjà fuité en novembre dernier. Une partie des informations de la présentation est contenue dans la présentation AMD ci-jointe, d'autres détails sont exclusifs à la présentation faite lors de l'ISSCC.

 
 

Carrizo est ainsi une puce de 244,62mm² intégrant 3,1 milliards de transistors gravés en 28nm, un gain en densité important puisque Kaveri n'était qu'à 2,41 milliards de transistors pour 245mm². Ce gain en densité est entre-autre lié au gain de place sur la partie x86 du fait de l'utilisation de règles de design inspirées du monde GPU et destinées à prioriser la densité et la consommation, quitte à avoir une montée en fréquence moins optimale.

Le gain est énorme en terme d'espace puisque de l'ordre de 35% à 38% sur certaines zones. Au final, et hors cache L2, un module Excavator (2 cœurs) occupe 23% moins d'espace qu'un module Steamroller avec seulement 14,48mm² alors qu'il passe de 86 à 102 millions de transistors. Cette hausse est liée à des modifications permettant d'augmenter l'IPC, AMD faisant état d'un gain de 5%, notamment avec un doublement du cache L1 data qui passe de 16 à 32 Ko par cœur. Qui dit hausse de la densité dit également hausse de la densité thermique, pour contrecarrer ce phénomène AMD à intercalé entre les deux modules Excavator le contrôleur mémoire qui a tendance à moins s'échauffer.

La partie GPU n'est pas dénuée d'amélioration puisque AMD utilise désormais le 28nm de manière à obtenir des transistors avec des courants de fuite plus faibles, quitte à atteindre des fréquences moins importantes. Cela permet à AMD d'annoncer une fréquence 10% supérieure au sein de la même enveloppe thermique ou une consommation inférieure de 20% à la même fréquence. Le GPU dispose de plus d'une alimentation dédiée (VDDGFX), qui vient s'ajouter à VDDCPU et VDDNB qui sont respectivement pour les modules x86 et le chipset intégré.


Puisqu'on parle de la tension, AMD intègre un mécanisme visant à adapter très rapidement, en moins de 1ns, la fréquence CPU ou GPU en cas de chute de la tension d'alimentation. Ceci permettrait d'utiliser une marge de sécurité moins importante vis à vis de la tension et de gagner environ 5% de fréquence à tension égale, AMD annonçant des gains de consommation pouvant atteindre 19% côté CPU et 10% côté GPU. Ce n'est pas la seule amélioration dans la consommation puisque les cœurs Excavator intègrent la technologie AVFS (adaptive voltage-frequency scaling). Il s'agit d'une dizaine de capteurs qui sont capables de détecter quand le processeur est proche de faire des erreurs de calcul, sans en être encore à ce stade, et qui remontent alors à une unité dénommée SMU (pour system-management unit) des informations sur la tension, la fréquence et la température. Sur la base de ces statistiques, cette unité se charge alors de créer et maintenir une table de fréquence / tension optimale pour chaque exemplaire de Carrizo.

Si 32 des 690 millions de transistors supplémentaires sont utilisés côté x86, le reste est dédié à des améliorations sur les cœurs GCN pour le HSA, un décodeur vidéo amélioré supportant le H.265 (mais AMD ne précise pas encore si le 10-bit est pris en charge), un doublement de l'encodeur vidéo ce qui permet d'aller 3.5x plus vite que sur Kaveri (il est question de 9 flux 1080p à 30 fps en H.264). Enfin Carrizo est désormais un SoC complet et intègre un FCH (southbridge) qui n'est pas détaillé officiellement ici mais qui devrait entre autre gérer 4 USB 3.0, 4 USB 2.0 et 2 SATA 6 Gbs. Son intégration dans la puce fait que sa consommation est probablement incluse dans le TDP et qu'il est gravé en 28nm alors que ces puces ont traditionnellement plusieurs process de retard. Pour rappel Intel utilise sur Broadwell 14nm en version BGA une puce PCH séparée gravée en 32nm, au contraire de Bay Trail-D et son successeur Braswell qui sont eux des SoC à l'instar de Carrizo.

L'A70M utilisé avec Kaveri était gravé en 65nm et avait un TDP de 4,7w pour une consommation au repos de 750mW, cette intégration devrait donc nettement améliorer la consommation en charge comme au repos. AMD ajoute d'ailleurs sur ce SoC la gestion d'un nouveau mode de veille qui permet d'avoir une consommation très basse, proche du S3 (suspend to ram) avec moins de 50 mW sur l'APU mais avec une sortie de veille encore plus rapide ce qui permet au système d'utiliser ce mode plus régulièrement, par exemple pour le Connected Standby. La sortie de ce mode S0i3 est par contre bien plus lente que chez Intel, moins de 500ms contre 3.1ms sur Haswell notamment grâce au régulateur de tension intégré, ce qui empêchera le système d'exploitation d'utiliser aussi souvent que sur Haswell.

Au final les diverses améliorations permettent à AMD d'annoncer que son SoC Carrizo, qui sera décliné dans des versions 12 à 35 watts alors que Kaveri allait de 17 à 35 watts, disposera de cœurs x86 avec une consommation en baisse de 40% par rapport à Kaveri, contre 20% de mieux pour les unités GCN, ce qui devrait permettre d'avoir des fréquences et donc des performances en hausse avec ces enveloppes thermiques réduite, ce malgré les gains modérés côté IPC... et la finesse de gravure qui reste en 28nm ! Les équipes n'ont pas manqué d'ingéniosité pour arriver à un tel tour de force, tout en intégrant des nouveautés telles que le FCH intégré sans augmenter la taille et donc le coût de la puce. Afin de pouvoir continuer de lutter contre un Intel qui dispose désormais de deux générations de process d'avance, de telles avancées étaient absolument nécessaires et l'avenir nous dira si elles sont suffisantes en pratique. Les portables Carrizo devraient pour rappel débarquer aux alentours de la mi-2015, nous avions pu observer un prototype lors du CES en début d'année.

Nous finirons par une petite digression sur Carrizo et le FM2+. Comme indiqué il y a un mois, cette version n'est plus à l'ordre du jour, et cette présentation donne des détails sur ce sujet puisqu'on voit bien que les optimisations visent la plage de consommation du SoC BGA, au dépend de celle utilisée sur FM2+, si bien que la décision de ne pas décliner Carrizo sur FM2+ ne semble pas dater d'hier. Ainsi si Excavator apporte des gains à 5, 10 ou 15 watts de consommation par module, arrivé à 20 watts l'écart se réduit à peau de chagrin et l'avantage repasse probablement à Steamroller au delà de 25 watts. Même avec le gain d'IPC de 5% le compte ne doit pas y être lorsqu'on est à 30 ou 40 watts par module comme c'est le cas sur les Kaveri FM2+. Au-delà de ça, Carrizo tel qu'il nous est présenté n'aurait pas forcément pu fonctionner sur FM2+ puisque l'intégration d'une tension spécifique pour le GPU implique des modifications au niveau de l'étage d'alimentation des cartes mères. Peut-être qu'AMD aurait pu passer outre, mais se pose alors le problème d'utiliser un FCH externe au lieu du FCH interne, sans parler des lignes PCIe Gen3 moins nombreuses puisqu'elles sont a priori de 8 sur Carrizo. Pour les vraies nouveautés en desktop (passons sur Godavari) il faudra donc attendre 2016 et la prochaine architecture x86 AMD dénommée Zen. Vivement !

La HBM 128 Go /s fait bien 1 Go, quid d'AMD Fiji ? MAJ

Tags : AMD; Fiji; GDDR5; HBM; SK Hynix;
Publié le 23/02/2015 à 23:57 par Marc Prieur

Ce contenu a été actualisé le 23/02/2015 après une première publication le 20/02/2015

Depuis le troisième trimestre 2014, le catalogue mémoire SK Hynix fait mention de mémoire HBM (High Bandwith Memory). La dernière version de ce catalogue corrige une erreur qui était présente jusqu'alors, la capacité de cette puce HBM est bien de 1 Go et non 1 Gb (soit 128 Mo).


Pour rappel ce type de mémoire est composé d'un die logique de contrôleurs mémoire ainsi que de multiples dies de mémoire, ici 4, le tout étant relié les uns aux autres par des TSV (Through Silicon Vias), littéralement de petits trous dans les puces pour laisser passer des fils afin de connecter les dies entre eux.

L'avantage de la HBM se situe au niveau de la bande passante sur une même puce du fait d'un bus externe très large de 1024-bit. Malgré une vitesse de seulement 1 GT/s, cela permet à la H5VR8GESM4R-20C d'atteindre 128 Go /s. A titre de comparaison, une puce GDDR5 à 8 GT/s en 32-bit atteint 32 Go /s, mais sur les cartes graphiques plusieurs puces sont adressées en parallèle sur un bus de 128 à 512-bit, ce qui permet d'atteindre en théorie jusqu'à 512 Go /s.

Si la HBM Hynix est affichée depuis le troisième trimestre 2014 comme disponible sur son catalogue, il s'agit de plus probablement d'une erreur puisque dans une présentation datée d'octobre ce dernier indiquait avoir débuté l'échantillonnage pour qualification auprès de ses clients en septembre 2014 avec une production en volume lancée au premier trimestre 2015.

Les rumeurs vont bon train sur Internet concernant l'utilisation de HBM par le prochain GPU haut de gamme d'AMD, Fiji, dont on attend l'arrivée pour la mi-2015. Celles-ci ont parfois tendance à s'auto-alimenter comme c'est souvent le cas sur le net, autant faire un point sur le sujet. En premier lieu elles ont eu pour source le fait que la HBM est un standard JEDEC initialement co-développé par AMD et SK Hynix, AMD ayant été historiquement très actif dans dans le domaine de la mémoire graphique et d'ailleurs le premier à utiliser la GDDR5, et que la production en volume de la première génération est donc imminente chez SK Hynix. S'ajoute à ceci quelques rapports Sandra (certains datant d'Octobre) mentionnant un GPU à 64 CU et bus 4096-bit. Enfin en début d'année 2015 un ingénieur AMD avait indiqué sur sa fiche LinkedIn qu'il avait participé au développement d'un GPU 300W "2.5D" utilisant de la HBM et un silicon interposer.

Ce faisceau d'indice qui grossit est-il suffisant pour envisager l'utilisation de HBM dès Fiji avec certitude ? Pas complètement. Tout d'abord, AMD est loin d'avoir utilisé toutes les capacités de la GDDR5 jusqu'alors puisqu'il ne fait appel qu'à de la GDDR5 à 5 GT/s sur les R9 290X. Avant de partir sur la HBM, il dispose donc d'une marge de manœuvre côté bande passante en conservant un bus 512-bit GDDR5, avec de la mémoire pouvant être 40% plus rapide en configuration 4 Go (16x256 Mo à 7 GT/s) et 60% plus rapide en 8 Go (16x512 Mo à 8 GT/s). Au mieux on pourrait ainsi atteindre 8 Go à 512 Go /s.

Si cette première génération de puces HBM est une étape importante, la combinaison de sa capacité et de son débit fait que son utilisation sur un GPU haut de gamme ne semble pas être si pertinente qu'elle peut y paraître au premier abord. Les rumeurs font ainsi état d'un énorme bus 4096-bit sur Fiji, mais cela ne permettrais finalement "que" d'adresser 4 puces HBM en parallèle et d'atteindre donc une capacité de 4 Go à une vitesse de... 512 Go /s. Quel est l'intérêt de partir sur une technologie qui en est encore à ses débuts, avec les surcoûts et risques que cela induit, si la bande passante n'augmente pas alors que la mémoire vidéo est bloquée à 4 Go, ce qui peut poser des problèmes notamment pour une déclinaison FirePro ?

L'efficacité énergétique de cette HBM de 1ère génération est supérieure à celle de la GDDR5 pour une telle bande passante, mais il n'est pas certain que ce soit un avantage décisif par rapport à la gourmandise d'un GPU haut de gamme. Les watts de gagnés au niveau des contrôleurs mémoire pourront être utilisés pour pousser plus loin le reste du GPU, mais en contrepartie les puces mémoire seront positionnées au niveau du packaging GPU ce qui va complexifier le refroidissement du tout. Est-ce pour cette raison, en sus des 300W mentionnés plus haut, que AMD envisagerais selon la rumeur de faire appel à un watercooling AIO pour Fiji ?

D'autres bruits de couloir font par ailleurs état d'une exclusivité d'AMD sur la HBM auprès de SK Hynix sur cette première génération, et il est possible que AMD souhaite dans tous les cas l'utiliser ne serait-ce que pour l'aspect marketing, voire soit obligé contractuellement d'acheter la HBM de 1ère génération à SK Hynix.


C'est surtout la seconde génération de HBM qui devrait s'imposer sans discussion possible sur les GPU haut de gamme. Les débits seront alors doublés, avec 256 Go /s par puce, et les capacités atteindront 4 et même 8 Go par puce... multipliez par 4 et les chiffres font rêver ! Alors que la GDDR5 pourrait suffire pour les GPU haut de gamme de 2015 si elle est pleinement exploitée, la HBM deviendra par contre essentielle pour tirer pleinement parti du saut de puissance attendu en 2016 avec l'arrivée du 14nm.

Une utilisation de la HBM de 1ère génération par Fiji est bien entendu possible, mais dans ce cas nous sommes impatients de savoir ce qui le justifiera par rapport à la GDDR5. Quoi qu'il en soit nous préférons ne pas avoir d'attente particulière côté mémoire et être agréablement surpris, par exemple avec une HBM qui serait plus rapide que ce qu'annonce Hynix à son catalogue (un des rapports Sandra parle de "1.25 GHz"), qu'être "déçus" si finalement Fiji se "contentait" de GDDR5... même si ce sont bien entendu les performances finales qui importent !

GPU, 71% pour Intel et 76% pour Nvidia

Tags : AMD; Intel; Nvidia;
Publié le 21/02/2015 à 19:27 par Marc Prieur

John Peddie Research a publié son analyse pour le marché graphique PC au quatrième trimestre 2014 et donne comme à son habitude une partie des éléments sur son site. Généralement ce trimestre est relativement stable par rapport au troisième, cette fois JPR note une baisse de 3,4% au global, plus précisément 2,7% sur les PC fixe et 3,9% sur les portables.

C'est Intel qui domine au global du fait des GPU intégrés à ses processeurs, même si ils ne sont pas toujours utilisés en pratique, avec 71,4% du marché. C'est un peu moins bien qu'au trimestre précédent (71,8%) mais la hausse est notable par rapport à l'an passé (66,8%). Nvidia occupe désormais la seconde place avec 15% du marché, un chiffre en hausse par rapport au trimestre précédent (14,1%) mais en baisse sur un an (15,7%). AMD rétrograde à la troisième place avec 13,6%, contre 14,1% il y a trois mois et 17,3% il y a un an.

Par rapport au trimestre précédent, en volume les ventes d'Intel et d'AMD baissent respectivement de 4 et 7% alors que celles de Nvidia augmentent de 2,9%. AMD souffrirait particulièrement d'une baisse de 30% des APU sur PC fixe, alors que celles sur portable sont en hausse de 4,6%. Les GPU additionnels seraient en baissent de 16% sur fixe et 16,6% sur portable. A contrario Nvidia aurait vu ses ventes augmenter de 5,5% sur les GPU pour PC fixe, contre un petit +0,1% sur portable. Sur les cartes graphiques, AMD ne serait plus qu'à 24% de parts de marché contre 76% à Nvidia.

 
 

JPR a également dévoilé au passage deux graphiques sur l'évolution historique du marché, le premier montre l'évolution depuis 1981 des ventes de PC fixes et portables ainsi que des GPU et iGPU pour PC fixes et portables. Le second écarte les GPU intégrés pour se concentrer sur les ventes de carte graphiques additionnelles comparées à celles du nombre de PC fixe depuis 2001. JPR en déduit un % de PC vendu avec carte graphique qui est passé de 70 à 80% en début de période à moins de 40% désormais, un chiffre qu'il faut encore minorer puisqu'un même PC peut très bien accueillir plusieurs cartes graphiques au cours de son existence, en même temps ou non.

Acer XG270HU, 1440p 144 Hz TN et FreeSync

Publié le 19/02/2015 à 09:00 par Marc Prieur

Acer rejoint la liste des fabricants de moniteurs FreeSync avec le XG270HU. Cet écran avait en fait déjà été annoncé au CES, en même temps que le XB270HU qui utilise pour sa part G-SYNC, mais le FreeSync n'était alors pas mentionné.


Dans les deux cas il s'agit d'écrans 27 pouces 2560x1440 144 Hz, mais alors que pour le XB270HU Acer mettait en avant les angles de visions à 178 degrés du fait d'une dalle IPS, sur le XG270HU c'est le temps de réponse de 1ms qui est mis en avant et qui découle de l'usage d'une dalle TN. Il s'agit donc d'un concurrent direct du BenQ XL2730Z qui dispose des mêmes caractéristiques, on ne sait pas si à l'instar de ce qu'il a fait côté G-SYNC Acer lancera ensuite une version IPS.

Pour rappel un écran FreeSync est un écran supportant la norme VESA Adaptive-Sync qui sera exploitée par les GPU AMD et dont la dalle est conforme à certains critères de qualité d'AMD qui n'ont pas encore été précisés. Par exemple un écran 60 Hz dont la dalle ne pourrait descendre sous les 45 Hz sera Adaptive-Sync, et pourra utiliser le rafraichissement variable dans l'intervalle 45-60 Hz, mais ne devrait pas pouvoir avoir le logo FreeSync a contrario d'un écran pouvant fonctionner entre 30 et 60 Hz.

Les APU Kaveri et Kabini supportent FreeSync de manière complète, tout comme les R9 295X2, 290X, 290, 285, R7 260X et R7 260. Pour les solutions basées sur GCN plus anciennes il faudra se contenter du rafraîchissement variable pour les économies d'énergie et en lecture vidéo. Côté disponibilité il est question de fin mars, sachant qu'aux dernières rumeurs c'est également en mars que les pilotes Catalyst permettant d'utiliser FreeSync seront rendu publics.


Top articles