Intel lance les Xeon Phi 5110P

Publié le 12/11/2012 à 22:00 par
Imprimer

Après AMD et Nvidia, c'est ce soir au tour d'Intel d'annoncer officiellement ses cartes accélératrices pour calculs parallèles dédiées au marché HPC (Hautes Performances) : les Xeon Phi.


Nous avions présenté précédemment l'architecture de ces puces. Il s'agit pour rappel d'un processeur x86 très particulier où l'on retrouve sur le die 64 cores x86 de type P54C (Pentium) sur lesquels sont accolés un cache de niveau 2 ainsi qu'une large unité de calcul vectorielle (le P54C servant de chef d'orchestre en quelque sorte). Tous ces cœurs sont reliés autour d'un large ring bus (512 bits dans chaque sens) qui relie également ces cœurs à des contrôleurs mémoires GDDR5. Pour terminer ce rappel, terminons en indiquant qu'une des particularités du design de Xeon Phi est que les cartes font tourner leur propre système d'exploitation (un Linux) dans lequel s'exécutent les programmes.


Intel annonce donc aujourd'hui sa première carte, le coprocesseur Xeon Phi 5110P. Fabriqué en 22nm, on retrouve 60 cœurs actifs sur le die cadencés à une fréquence de 1.053 GHz. Xeon Phi est fabriqué en 22nm et chaque cœur dispose de 512 Ko de cache de niveau 2.

Côté performances, le constructeur annonce 1010 Gigaflops en double précision, soit légèrement moins que les produits concurrents annoncés ce matin (1173, 1317 et 1478 respectivement pour les Tesla K20, K20X et Firepro S10000). Xeon Phi se distingue cependant côté mémoire avec 8 Go de mémoire GDDR5 (2.5 GHz) embarquée (5, 6 et 3 Go pour les Tesla K20, K20X et Firepro S10000 toujours) et une bande passante de 320 Go/secondes (contre 193.7, 232.4 et 447 Gio/s pour les modèles cités précédemment).


Côté tarifaire Intel est cependant plus agressif puisque sa carte est annoncée à 2649$ (3200, 5000 et 3600$ pour les cartes de Nvidia et d'AMD). Une position qui n'est pas surprenante, Intel étant un nouvel entrant sur ce type de marchés.


Petit tacle en passant à la concurrence…

En ce qui concerne le développement d'application, Intel se repose avant tout sur ses propres compilateurs (avec des jeux d'extensions propriétaires) et ses bibliothèques comme MKL (Math Kernel Library) qui ont été portés pour l'architecture Xeon Phi.


Intel indique cependant qu'il s'agit d'une approche "pré-standard" et que l'avenir, aussi bien pour Nvidia que pour Intel est à la version 4.0 d'OpenMP qui - selon Intel - devrait représenter l'avenir de toutes les solutions de développement parallèles. Intel indique s'engager à fournir un compilateur OpenMP 4.0 pour le mois de janvier.


Notez que si les cartes Xeon Phi sont officiellement lancées aujourd'hui (Intel indique commencer les livraisons aujourd'hui à ses partenaires), la disponibilité générale des 5110P ne se fera que le 28 janvier 2013. D'autres déclinaisons sont également prévues avec la famille Xeon Phi 3100 annoncés pour la première moitié 2013 (et qui devraient reposer sur une nouvelle version de la puce). Disponibles en versions actives et passives pour un TDP de 300 watts, les cartes viseront au-delà d'un téraflop DP pour un prix inférieur à 2000$. Le nombre de cœurs actifs sur ces cartes n'est pas officiellement annoncé, mais avec 28.5 Mo de mémoire cache L2 sur les 3100 Series, il devrait être de 57. Les cartes embarqueront également moins de mémoire avec seulement 6 Go, la bande passante tombant à 240 Go/s.

Pilotes GeForce beta 310.54

Publié le 12/11/2012 à 18:18 par
Imprimer

Nvidia vient de rendre disponible un nouveau pilote beta pour ses cartes graphiques GeForce. Ces 310.54 reprennent les optimisations des pilotes beta précédents (les 310.33, voir cette actualité) et apportent de nouvelles optimisations pour deux jeux qui seront lancés dans les prochains jours : Call of Duty : Black Ops 2 et Assassin's Creed III.

Le constructeur annonce ainsi jusque 26% de gains sous Black Ops 2 (GeForce GTX 680 en 1080p avec MSAA 8x) et 17.8% sous Assassin's Creed 3 par rapport à ses pilotes WHQL. Les deux jeux supportent également l'anti-aliasing TXAA (qui mélange FXAA et MSAA). Un gain de performance de 12.9% sous Battlefield 3 (1920x1080, Ultra sur la carte Paris) est également annoncé.

En pratique, de notre côté, nous avons pu confirmer ces gains significatifs sous Battlefield 3 avec une GTX 680 en 1080p : +15% en qualité élevée et +10% en qualité ultra. Nvidia aurait-il été inspiré par les optimisations récentes introduites par AMD pour ce moteur graphique ?

Notez enfin que de nouveaux profils SLI ont été ajoutés pour Hawken, Hitman : Absolution, Natural Selection 2 et Primal Carnage. Ces pilotes sont disponibles en français, en version 64 bits  et en version 32 bits  sur le site de Nvidia.

AMD FirePro S: Tahiti bi-GPU pour serveurs

Tags : AMD; FirePro; GCN;
Publié le 12/11/2012 à 17:34 par
Imprimer

Tout comme Nvidia avec les Tesla K20, AMD profite de la conférence SC12 pour présenter un nouvel accélérateur dédié aux serveurs : la FirePro S10000. Nous l'avions en réalité déjà aperçue puisqu'il s'agit de la mystérieuse carte bi-GPU exposée brièvement par le CTO d'AMD lors de l'AFDS 12 de juin.


La FirePro S10000 vient rejoindre les FirePro S9000 et S7000 annoncées cet été et dont la production vient de débuter. Cette gamme FirePro S est dédiée aux serveurs tout en conservant une large polyvalence. Pour se positionner différemment face aux solutions de Nvidia, mais également pour faire face à des volumes de vente relativement faibles, AMD a en effet décidé de ne pas spécialiser les FirePro : tous ces modèles sont ainsi adaptés autant à la visualisation (vs Quadro) qu'au calcul haute performante (vs Tesla) ou à la virtualisation (vs VGX).

AMD indique que l'adoption d'OpenCL par de plus en plus de développeurs ouvre la voie aux FirePro S dans le domaine du calcul où il espère enfin qu'elles trouveront leur place. Si l'architecture GCN sur laquelle reposent les GPU qu'elles embarquent est très évoluée et pensée pour le calcul massivement parallèle, l'écosystème proposé par AMD doit encore obtenir la confiance de l'industrie.


Avec la FirePro S10000, AMD s'assure de proposer l'accélérateur le plus puissant à ce jour, devançant la Tesla K10 en calcul simple précision et la Tesla K20X en double précision. Pour cela, ce sont deux GPU Tahiti, certes castrés, qui sont de la partie.



De leur côté, les FirePro S9000 et S7000 sont respectivement basées un GPU Tahiti (Radeon HD 7900) ou Pitcairn (Radeon HD 7800). Pour se différencier des solutions grand public similaires (rappelons que contrairement à Nvidia, AMD ne les bride pas), elles embarquent une quantité importante de mémoire, 6 Go et 4 Go, et sont proposées en versions passives, double et simple slot.


Etrangement, la FirePro S10000 introduite aujourd'hui ressemble plus à un produit workstation (FirePro W) qu'à un produit serveur. Bi-GPU oblige, son TDP grimpe à 375W et demande un refroidissement actif, composé de 3 ventilateurs sur ce design qui semble peu adapté à un serveur. Par ailleurs, chaque GPU doit se contenter de 3 Go de mémoire, un espace relativement faible par rapport aux dernières solutions mono-GPU.

Difficile donc d'imaginer quelle place pourrait se faire cette FirePro S10000, qui ne prendra probablement de l'intérêt que dans des utilisations très spécifiques telles que de la virtualisation d'applications graphiques professionnelles. Elle sera disponible sous peu au tarif de 3600$ contre 2500$ pour la FirePro S9000 et 1250$ pour la S7000.

GK110 : Nvidia lance les Tesla K20 et K20X

Tags : CUDA; GK110; Nvidia; Tesla;
Publié le 12/11/2012 à 15:35 par
Imprimer

A l'occasion de la conférence SC12, dédiée aux supercalculateurs et technologies liées, Nvidia annonce la disponibilité commerciale de l'accélérateur Tesla K20 dont nous vous avions déjà parlé. Cette carte embarque un GPU GK110 qui reprend l'architecture Kepler déjà en place sur les GeForce GTX 600 mais légèrement retouchée pour faciliter l'exploitation du GPU en tant qu'accélérateur.


Le GPU GK110 et ses 7.1 milliards de transistors.

Parmi les avancées citons une capacité de traitement en double précision très élevée, un texture cache plus flexible et surtout un processeur de commande plus évolué. Il est capable de gérer jusqu'à 32 files d'attente d'exécution pour mieux exploiter la capacité du GPU à exécuter plusieurs tâches concurrentes, ce que les GPU Nvidia précédents avaient du mal à faire en pratique. Il est également capable d'auto-générer des tâches, ce qui évite des allers-retours incessants avec le CPU qui réduisent l'efficacité réelle de l'accélérateur.


Par rapport à nos précédentes informations, les spécifications de la Tesla K20 sont confirmées, si ce n'est au niveau de la mémoire où elles évoluent très légèrement. Elle est donc bien basée sur un GK110 castré qui se contente de 13 blocs d'unités de calcul, SMX, sur les 15 physiquement présents sur la puce. Il en va de même pour les contrôleurs mémoire dont seulement 5 des 6 sont exploités, ce qui limite la mémoire de la Tesla K20 à 5 Go (4.38 Go avec ECC actif).

Petite surprise, Nvidia lance également une Tesla K20X. Le GK110 qu'elle embarque profite cette fois bien de 14 SMX, pour se rapprocher des 4 Tflops, ainsi que de ses 6 contrôleurs mémoire qui disposent donc de 6 Go de GDDR5 (5.25 Go avec ECC actif). C'est en réalité cette Tesla K20X qui prend place dans le supercalculateur Titan et nous pouvons imaginer que Nvidia a dû sortir 2 variantes de la K20 d'une part pour respecter le cahier de charge au niveau de ce supercalculateur et d'autre part pour disposer d'une production suffisante. Fabriquer un GPU de 7.1 milliards de transistors en 28 nanomètres reste un défi !

Avec plus d'unités de calcul et une fréquence légèrement supérieure, la Tesla K20X ne peut se contenter du TDP de 225W de la Tesla K20. Nvidia a cependant pu le limiter à une valeur proche : 235W. Il nous a par ailleurs été confirmé qu'une technologie de contrôle de la consommation similaire au GPU Boost des GeForce GTX 600 était bien présente sur cette carte et qu'elle pourrait éventuellement être personnalisée par certains fabricants de stations de travail et de serveurs, soit pour adapter la limite de consommation, soit pour activer sa composante turbo.


La Tesla K20 sera disponible en version workstation (refroidissement actif) ainsi qu'en version serveur (refroidissement passif) alors que la Tesla K20X n'existera que dans cette dernière version. Au moins deux formats serveurs sont proposés par Nvidia : carte PCI Express "classique" telle qu'illustrée ici ou SXM, similaire au MXM des cartes graphiques mobiles.


La disponibilité des Tesla K20 et K20X est annoncée pour la fin de ce mois avec un tarif de 3200$ pour la première alors qu'il faudra compter 5000$ pour la seconde. Des tarifs nettement plus élevés que sur la génération précédente qui laissent penser que, pour Nvidia, l'adhésion de l'industrie du calcul haute performance à ces accélérateurs massivement parallèles est désormais inéluctable. Nvidia compte sur un écosystème CUDA relativement répandu et réputé pour faire face à la concurrence des FirePro S d'AMD et des Xeon Phi d'Intel.

Caractéristiques des Intel Series 8

Publié le 12/11/2012 à 15:27 par
Imprimer

En plus des informations sur la version ULT d'Haswell, nos confrères d'Expreview  ont publié un slide évoquant les caractéristiques des chipsets Lynx Point, ceux qui accompagneront les processeurs Haswell et que l'on connaitra sous le nom de Intel Series 8.


Certaines caractéristiques que l'on avait entrevues sont officialisées comme le support de 6 ports USB 3.0 (au lieu de 4 pour les Series 7) ainsi que 6 ports Serial ATA 6 Gb/s (contre 2). Petit détail que l'on apprend sur ces slides, deux des ports USB 3.0 et deux des ports SATA 3.0 partageraient la bande passante des lignes PCI Express additionnelles (au nombre de 8 et toujours malheureusement au standard PCIe 2.0) qui seraient ainsi désactivées. Il faudra voir en pratique comment s'opéreront ces restrictions. L'interconnexion entre le chipset et le processeur restera effectuée par ce qu'Intel appelle un lien DMI, à savoir un lien PCI Express 2.0 x4 comme actuellement. On notera également que si l'interface FDI est toujours présente (un lien interne basé sur DisplayPort qui permet de transférer la vidéo entre le processeur et le chipset qui pilote les sorties), seule la gestion VGA reste intégrée dans le chipset. HDMI, DP et LVDS (interface historique utilisée sur les portables) disparaissent et devront être gérés par une puce externe.


La version "LP" de Lynx Point, celle qui sera intégrée au package des Haswell ULT (Ultrabook) est également évoquée. Quelques restrictions à noter, seulement 8 ports USB 2.0 et 4 ports USB 3.0 sont gérés, ainsi que 3 ports Serial ATA 6 Gb/s (un quatrième au standard 3 Gb/s est présent). On notera d'ailleurs côté stockage la disparition du mode d'émulation IDE. La gestion des sorties graphiques est complètement supprimée du chispet tout comme le lien d'interconnexion FDI, la connectivité écran avec les contrôleurs externes se faisant directement au niveau du CPU. Côté son, un contrôleur HD Audio serait également intégré, là encore une nouveauté.

Notons enfin que l'interconnexion entre le chipset et le processeur se fera par le biais d'une nouvelle interface (baptisée OPI, On Package Interface) dont on ne connait que la largeur, x8. On ne sait pas encore s'il s'agirait d'une interconnexion PCI Express 2.0 x8, un changement qui serait le bienvenu, même si dédié uniquement ici à la version Ultrabook !

L'i7-3970X est lancé

Publié le 12/11/2012 à 15:10 par
Imprimer

Nous en parlions il y a un mois. L'i7-3970X arrive désormais en boutique. Via un lancement en catimini, sans annonce ni effets de manche, ni même inscription sur ark.intel.com qui référence toujours l'i7-3960X comme seul i7 Extrême de seconde génération disponible.

Les spécifications sont bien au rendez-vous (6 coeurs, 3,5 GHz / 4 GHz en boost, 15 Mo de cache L3 et 150W de TDP). On l'attendait autour des 1000€... là encore guère de surprises puisque la bête se rencontre autour des 1000-1050 €.

Haswell ULT : nouveaux modes d'économie d'énergie

Publié le 12/11/2012 à 14:48 par
Imprimer

Les détails sur Haswell, la prochaine génération de processeurs Intel continuent d'être distillés. Aujourd'hui, ce sont nos confrères d'Expreview  qui évoquent la version ULT dédiée aux Ultrabook. Comme nous l'avions vu l'année dernière, la version ULT d'Haswell est une déclinaison mobile qui a la particularité d'intégrer un chipset (southbridge) directement au sein du package du processeur.

Les Haswell ULT auront en prime la particularité, c'est ce que rapportent nos confrères, de disposer de nouveaux C-States. Pour rappel les C-States représentent les différents modes de fonctionnement des processeurs. L'état C0 indique un mode de fonctionnement normal (le processeur est actif) et les modes suivants (C1 à C6) désactivent graduellement différentes parties du processeur afin d'économiser un maximum d'énergie. Plus un état est élevé et plus la consommation est réduite, au détriment du temps nécessaire pour "rallumer" le processeur.

 

Trois nouveaux états, C8, C9 et C10 seraient ainsi ajoutés par Intel avec la particularité pour la première fois de pouvoir éteindre la BCLK externe cadencée par défaut à 100 MHz pour économiser encore plus d'énergie au niveau de la plateforme. Une nouvelle horloge additionnelle fonctionnant à 24 MHz serait alors ajoutée : elle servira à recalibrer la BCLK à 100 MHz lorsque le processeur deviendra de nouveau actif. Selon les slides publiés, ces modes seront réservés uniquement au fonctionnement sur batterie.

Archon SB-E X2, 1 ventilateur de +

Tag : Thermalright;
Publié le 12/11/2012 à 14:07 par
Imprimer

Thermalright a récemment mis en ligne l'Archon SB-E X2. Cette version reprend le design de l'Archon SB-E avec 8 caloducs de 6mm de diamètre et dispose cette fois de deux ventilateurs.


Il s'agit en l'occurrence de deux TY-141, des modèles PWM tournant de 900 à 1300 rpm pour 17 à 21 dBA émis. L'ensemble mesure 155mm x 106mm x 170mm (hauteur) avec les deux ventilateurs installés. La fiche complète du Archon SB-E X2 est disponible ici. Pas encore de prix pour le moment, mais selon toute vraisemblance la version X2 devrait être vendue un peu au dessus des 70 - 75€ demandés pour un Archon SB-E.

Top articles