Actualités informatiques du 24-07-2013

Intel dévoile l'AVX-512
Kepler mobile & Logan: l'offensive de Nvidia

Flux XML avec la liste des 20 dernières actualités.

Juillet 2013
L	M	M	J	V	S	D
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

Intel dévoile l'AVX-512

Tags : AVX-512; AVX2; Intel; Knights Corner; Knights Landing; Xeon Phi;

Publié le 24/07/2013 à 18:45 par Guillaume Louel

C'est par le biais d'un de ses blogs qu'Intel vient d'annoncer la prochaine version d'AVX, que l'on connaissait précédemment sous le nom de code 3.1 et 3.2. Il s'agira finalement d'AVX-512.

Comme son nom l'indique, AVX-512 est une extension du jeu d'instruction AVX qui rajoute des instructions SIMD (une instruction qui s'applique à de multiples données) 512 bits, soit le double de l'AVX actuel, pouvant cibler aussi bien des données entières que flottantes. Ce n'est pas la première fois que l'on voit un jeu d'instructions 512 bits chez Intel car c'est précisément ce que proposait le jeu d'instruction de Larrabee, et plus récemment de Knights Corner que l'on connait sous la dénomination commerciale Xeon Phi.

AVX-512 apporte une série de changements détaillés dans ce document PDF, on notera en premier lieu le nombre de registres qui passe de 16 à 32, tandis que les nouvelles instructions sont préfixées EVEX (au lieu de VEX pour AVX2). Ces dernières concernent aussi bien les entiers que les flottants et vous pourrez retrouver ci-dessous les grandes familles (classes) d'instructions disponibles.

La liste des classes d'instructions d'AVX-512. Vous retrouverez dans le PDF la liste complète des instructions à la page 75.

Notez qu'Intel parle dans son document "d'AVX-512 Foundation", sous entendant qu'il s'agit là du socle commun et que certains produits pourraient proposer des instructions supplémentaires. Ce n'est pas forcément surprenant puisque ces slides indiquaient que Knights Landing (la prochaine version de Xeon Phi) utiliserait AVX3.1, tandis que Skylake (la prochaine nouvelle architecture CPU d'Intel qui apparaitra après Broadwell en 14nm) utilisera AVX 3.2.

Il sera intéressant de voir ce qu'Intel fera exactement de ces unités AVX 512 bits dans le processeur Skylake. Le directeur du Visual and Parrallel Architecture Group d'Intel, Ofri Wechsler est en effet à la fois en charge des projets Xeon Phi du constructeur (l'actuel Knights Corner, le suivant Knights Landing, et le futur Knights Hill) mais aussi de l'architecture graphique qui sera utilisée dans Skylake.

Sa biographie sur le site d'Intel indique également qu'il était responsable du projet qui tentait de construire un pipeline de rendering 3D logiciel fonctionnant sur Larabee, l'ancêtre des actuels Xeon Phi. Si des rumeurs laissaient penser qu'Intel pourrait un jour utiliser ce type de solution pour remplacer un GPU, l'échéance de Skylake est probablement encore trop proche pour que l'on voit arriver ce type de solution pour remplacer l'iGPU intégré aux processeurs. Skylake dans sa version desktop est en effet prévu pour 2015.

Kepler mobile & Logan: l'offensive de Nvidia

Tags : Kepler; Logan; Nvidia; Tegra;

Publié le 24/07/2013 à 16:15 par Damien Triolet

Visiblement très actif lors de ce SIGGRAPH, Nvidia vient d'en dévoiler un petit peu plus au sujet de la variante ultra mobile de Kepler. Ce GPU prendra place dans le SoC Logan, probablement le futur Tegra 5, et viendra également concurrencer directement les PowerVR d'Imagination et autres Mali d'ARM.

Deux démonstrations techniques mettent tout d'abord en avant des capacités de rendu proches de ce qui se fait sur PC. Nvidia nous précise en effet que les fonctionnalités sont similaires à celles des gros GPU PC, que ce soit au niveau du support de DirectX 11.x (niveau 11_0), d'OpenGL 4.x, d'OpenCL ou encore du CUDA. Une révolution par rapport à OpenGL ES 2.0 qui limite les Tegra 2, 3 et 4 !

La première démonstration est une version simplifiée du rendu de visage réaliste qui avait été présentée à la GDC en mars dernier : FaceWorks Mobile. Cette démonstration avait été initialement faite sur base d'une GeForce GTX Titan et pour le SoC Logan, Nvidia a réduit la résolution et la qualité de certains effets de manière à conserver le principal tout en s'adaptant à un GPU annoncé comme capable de tenir dans une enveloppe thermique de 2W :

La seconde démonstration met de son côté en avant le support complet d'OpenGL 4.3 et d'effets tels que la tessellation, particulièrement utile dans le monde mobile puisqu'elle permet de réduire les transferts de données, plus énergivores que les opérations traitées par le GPU pour générer des triangles supplémentaires :

Ces démonstrations ne nous donnent pas de réelles indications concernant le niveau de performances du GPU de Logan, mais mettent par contre en avant le fait qu'il supporte bien toutes les dernières techniques de rendu et que son support logiciel est déjà bien avancé. En réalité, selon nos informations, cela fait plusieurs années que les développeurs de Nvidia préparent son support à travers une unification du cœur des pilotes entre les divisions GeForce et Tegra.

Nvidia ne rentre pas dans les détails techniques, ceux-ci seront dévoilés plus tard, mais parle malgré tout d'un GPU équipé de 192 unités de calcul (les "cores" en mauvais langage commercial) dérivées de l'architecture Kepler des GeForce 600 et 700. Notez que c'est différent de ce qui avait été sous-entendu au départ par Nvidia puisque ce dernier avait indiqué que la plateforme Kayla, destinée à émuler le SoC Logan, était associée à un GPU Kepler similaire équipé de 384 unités de calcul (le GK208).

Sans précision sur le détail de l'architecture, il est difficile de savoir comment sont organisées ces unités de calcul, cela pourrait être un seul SMX similaire aux GPU Kepler classiques ou quelque chose de totalement différent. Tout comme le récent GPU d'entrée de gamme de la marque, le GK208, il semble toutefois évident que le nombre d'unités de texturing sera proportionnellement réduit par rapport aux autres GPU Kepler. Ces unités sont liées à un flux de données continu, ce qui implique une dépense d'énergie importante. Les 192 unités de calcul de Kepler mobile seront ainsi probablement associées à 8 voire 4 unités de texturing.

Pour pouvoir tenir dans une enveloppe de 2W, Nvidia a également dû optimiser différents aspects de son GPU et mentionne par exemple une interconnexion interne revue. Celle-ci étant à la base conçue pour permettre à un nombre important de blocs d'unités de toutes sortes de communiquer entre elles, il semble logique que certaines simplification soient possibles à ce niveau pour un petit GPU. Pour le reste, il n'est pas impossible que la précision de calcul soit réduite quand toutes les unités sont exploitées, que certains datapaths ait été réduits en largeur ou que le débit de certaines unités ait été revu à la baisse. Certains compromis sont bien entendu nécessaires et ont été prévus lors du développement de l'architecture pour pouvoir faire passer Kepler de 250W dans une GeForce GTX Titan à 25W pour une GeForce GT 630 et à 2W pour le GPU de Logan.

Pour illustrer la puissance de ce GPU mobile, Nvidia nous fournit un graphe assez vague qui compare ce qui serait la puissance de calcul brute. Kepler mobile est décrit sur ce graphe comme étant 5x plus performant que le PowerVR SGX 554MP4 de l'iPad 4 et légèrement plus performant qu'une GeForce 8800 GTX, le haut de gamme de fin 2006. Nous n'en tirerons aucune conclusion puisque s'il s'agit bien de la puissance de calcul, elle serait alors de +/- 384 Gflops, ce qui correspondrait à un GPU Kepler mobile cadencé à 1 GHz. Une telle fréquence nous semble peu compatible avec les 2W annoncés par Nvidia et correspond probablement à une version du SoC avec TDP plus élevé. A l'opposé des performances maximales, Nvidia nous indique également que lorsque ce GPU est cadencé de façon à offrir les mêmes performances que celles du GPU de l'iPad 4, sa consommation est alors trois fois moindre.

Par ailleurs, il faut garder en tête que les performances en pratique d'un GPU ne dépendent pas exclusivement de sa puissance de calcul. La puissance de texturing et la bande passante mémoire sont deux éléments cruciaux qui devront faire avec les contraintes d'une enveloppe thermique compressée autant que possible. Le niveau de performances en pratique devrait plutôt se situer entre celui des GeForce 8600 GT et 9600 GT, suivant les versions, ce qui est déjà très bien.

Que retenir de tout cela ? Entre une démonstration simplifiée qui tourne sur un GPU simplifié et des détails techniques très vagues, l'annonce de Nvidia peut être vue comme une coquille vide, une tentative de démarrer du hype sur base de peu de choses. Si ce dernier aspect n'est pas à négliger, l'annonce de Nvidia est cependant loin d'être insignifiante.

Alors que ce SoC Logan est attendu dans le commerce au printemps prochain, les démonstrations de Nvidia représentent un avertissement clair à la concurrence : sa plateforme de développement est prête, l'environnement logiciel est prêt et les développeurs vont pouvoir facilement porter des graphismes plus évolués tirés du monde PC ou des consoles vers les périphériques mobiles.

Les concurrents principaux de Nvidia au niveau des GPU mobiles, Qualcomm (Adreno), Imagination (PowerVR) et ARM (Mali) ont depuis quelques années systématiquement une avance technologique sur Nvidia au niveau de leurs GPU. Ils dominent également largement le marché. Mais pourtant, sur le plan graphique, ils ne sont pas réellement parvenus à transformer leurs avantages sur le papier dans la pratique, soit par manque de moyens investis pour convaincre les développeurs de tirer le maximum de leur GPU, soit par une arrivée très tardive de pilotes complètement, voire même partiellement, fonctionnels.

Nvidia a probablement été clairvoyant et pragmatique à ce niveau en se contentant jusqu'ici de relativement peu sur le plan matériel pour ses GPU mobiles. De quoi pouvoir attribuer plus de ressources sur d'autres fronts en se contentant de son expérience dans le monde graphique pour préparer calmement l'arrivée d'une offensive enfin digne de la marque GeForce.

Cette offensive ce sera Logan. En profitant de son expérience et d'un GPU cette fois plus que compétitif, Nvidia compte bien s'affirmer comme la référence pour le jeu mobile et profiter de l'explosion de ce marché pour convaincre une part plus significative des fabricants de smartphones et tablettes de faire confiance aux SoC Tegra… ou tout simplement au GPU GeForce mobile/ULP. Il y a peu, Nvidia a en effet indiqué clairement que son GPU Kepler mobile serait disponible sous licence pour d'autres fabricants de SoC. Nul doute que l'annonce d'aujourd'hui pose la base d'une stratégie destinée à convaincre les partenaires d'Imagination ou d'ARM de changer de crèmerie !

Actualités précédentes - Mardi 23 Juillet 2013 Actualités suivantes - Jeudi 25 Juillet 2013

Juillet 2013
L	M	M	J	V	S	D
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

Juillet 2013
L	M	M	J	V	S	D
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

Actualités informatiques du 24-07-2013

Intel dévoile l'AVX-512

Kepler mobile & Logan: l'offensive de Nvidia

Top articles

Juillet 2013
L	M	M	J	V	S	D
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31