Intel Core i7-6700K, i5-6600K et Z170 : Skylake en test

Tags : Core i5; Core i7; DDR4; Intel; LGA 1151; Skylake; Z170 Express;

Publié le 05/08/2015 (Mise à jour le 28/09/2015) par Guillaume Louel et Marc Prieur

Si Intel utilisait jusqu'ici une stratégie dite de « Tick-Tock » pour ses architectures processeurs, ne changeant l'architecture CPU que tous les deux modèles, ce n'était pas le cas pour les architectures graphiques que le constructeur essaye de faire évoluer à chaque fois. Ainsi après la génération graphique 7.5 dans Haswell, nous avons eu droit respectivement à la génération 8 pour Broadwell, et aujourd'hui à la génération 9 pour Skylake.

Quatre déclinaisons

Depuis Haswell, Intel a étendu la flexibilité de ses GPU, proposant différents modèles qui se distinguent principalement par le nombre d'unités d'exécution qu'ils embarquent, allant à l'époque de 10 à 40 unités en fonction des modèles. Avec Broadwell, Intel a continué dans sa lancée en augmentant de 20% de nombre d'unités d'exécution, soit de 12 à 48 selon le modèle. Avec Skylake, Intel n'augmente pas le nombre d'unités par modèle, mais rajoute une option supplémentaire en haut de sa gamme avec 50% d'unités en plus. Voici un récapitulatif des modèles proposés :

Nombre d'unités d'exécution en fonction des modèles et des architectures Intel. En orange, les modèles déclinés en version eDRAM.
Haswell aura permis également pour la première fois de voir l'arrivée d'un cache de niveau 4 sur certains modèles. Il s'agit pour rappel d'une puce mémoire eDRAM additionnelle, rajoutée dans le package de certains modèles de processeurs. Une des particularités de ce cache est qu'il est global, pouvant servir à la fois aux cœurs CPU et au processeur graphique. Lorsqu'un processeur Intel est pourvu de cette mémoire additionnelle, le constructeur rajoute un « e » au nom du GPU (par exemple, GT3e).

Avec Haswell, Intel avait réservé l'eDRAM à certains modèles pour PC portables haut de gamme, ainsi qu'aux modèles desktop embarqués (pour machines tout en un, type iMac). Avec Broadwell, les choses ont été un peu différentes puisque le constructeur a proposé de l'eDRAM pour les seules puces qu'il aura lancé en version socket, les Core i7-5775C et Core i5-5675C qui embarquaient 128 Mo d'eDRAM. Des puces qui utilisaient le GPU « GT3e ».

En ce qui concerne les modèles desktop à socket, Broadwell détonne en étant le seul à utiliser GT3, qui plus est en version « e ». En général, les modèles desktop quadruples cœurs, et c'est le cas une fois de plus pour les Skylake « K » lancés aujourd'hui, utilisent le GT2 qui prend la nomenclature commerciale HD 530. Le nouveau GT4e devrait de son côté être proposé exclusivement sur les futurs modèles desktop BGA, tandis que les GT3e devraient selon toutes vraisemblances se retrouver sur les modèles mobiles.

Architecture graphique

D'un point de vue architectural, les changements de Broadwell concernaient principalement une augmentation de 50% du débit du texturing ainsi que 50% de cache de niveau 3 graphique supplémentaire. D'autres détails ont changé dans la microarchitecture pour améliorer les performances de fillrate, de la géométrie ou des opérations de profondeur mais Intel ne les a pas évoqués plus en détails.

Pour Skylake quelques détails commencent à filtrer, notamment sur l'organisation interne. Depuis Haswell Intel dispose d'une partie fixe baptisée Un-slice qui contient la gestion de la géométrie et d'autres fonctions fixes, et les Slices qui contiennent les EU (les groupes d'unités de calculs) ainsi que les sampler de textures (on fera le parallèle côté CPU entre Core et Uncore). Intel fait ainsi varier le nombre de slices pour créer des GPU à nombre d'EU variables. Avec Skylake, Intel aurait choisi d'utiliser deux plans d'alimentation distincts pour l'Un-slice et Slice.

Un autre changement concerne l'ajout d'un « fast path » pour la lecture vidéo, une fonctionnalité que l'on avait déjà vue introduite par AMD dans Carrizo. Il s'agit d'ajouter des blocs fixes capables d'effectuer les tâches les plus basiques comme par exemple mettre à l'échelle les vidéo (scaling). On sait qu'AMD propose également le désentrelacement, ce qui a première vue n'est pas le cas de Skylake. Malgré tout l'utilisation de ces unités permet d'éviter de passer par la mémoire du GPU et donc limiter la consommation en lecture.

On notera enfin au rang des nouveauté l'ajout de petites fonctionnalités comme la compression des couleurs (sans perte) pour réduire l'utilisation mémoire des textures et autres buffers, mais c'est surtout l'ajout de nouvelles extensions propriétaires qui surprend pour utiliser le GPU pour effectuer des tâches de retouche photo (correction de la balance des blancs, correction du vignettage, etc). Intel proposerait cela sous la forme d'extensions DirectX 11 propriétaires. Si le constructeur indique qu'elles sont flexibles, il faudra voir les API pour voir si elles seraient réellement utilisables par des logiciels spécialisés comme par exemple DxO OpticsPro, ou s'il s'agit juste de fonctions basiques. A suivre.

On notera enfin que le GPU de Skylake est conforme avec les features 12_1 tier 3 de DirectX12, ce qui en fait le GPU qui dispose du support actuel le plus complet (12_1 tier2 au mieux chez Nvidia, 12_0 tier3 chez AMD).

QuickSync

Une nouveauté que nous avons réussi à faire confirmer à Intel concerne les blocs de décodage et d'encodage vidéo. Par rapport à Haswell, Broadwell avait apporté l'accélération du décodage des formats VP8 ainsi que SVC (version « scalable » de l'AVC/H.264 destinée principalement au streaming avec possibilité de dégradation) en version High Profile.

Pour Skylake, nous avons droit à l'arrivée non seulement du décodage H.265 (mais seulement en mode "Main" 8bit malheureusement, le Main10 qui devrait être a l'avenir le format le plus répandu n'est pas supporté), que nous avions déjà croisé dans Braswell, mais aussi de son encodage ! Egalement connu sous le nom de HEVC, il s'agit d'un nouveau standard de codage vidéo ayant pour but de proposer une qualité équivalente à l'AVC (H.264) avec un bitrate divisé par deux, tout en étant optimisé pour les hautes résolutions (jusqu'au 8K).

Intel propose une API (MediaSDK) qui permet aux développeurs d'exploiter l'encodage vidéo accéléré (c'est le cas de logiciels commerciaux comme MediaEspresso de Cyberlink, ou Open Source comme Handbrake) mais malheureusement, aucun de ces logiciels ne proposent le support de l'encodage HEVC/H.265 via QuickSync au moment où nous écrivons ces lignes.

Gestion des écrans

La gestion des écrans sous Haswell et Broadwell était commune – plateforme identique oblige. Ces générations proposaient en interne quatre brins DDI pouvant être utilisés pour gérer jusque trois sorties numériques (DisplayPort 1.2, HDMI ou DVI-D, le VGA étant géré par le chipset) utilisables en simultanées (jusque 3 DP simultanés, jusque 2 HDMI/DVI-D). Il est possible de mutualiser ces brins pour atteindre des résolutions plus élevées. En pratique on pouvait ainsi atteindre le 4K en 24 Hz en DisplayPort 1.2 ou en HDMI 1.4a (le DVI-D restant limité au 1920 par 1200). La résolution maximale offerte en 60 Hz via DisplayPort était le 3840x2160.

Avec Skylake Intel a revu son système de gestion en supprimant le lien FDI entre le processeur et le chipset qui servait notamment pour l'affichage VGA. Aujourd'hui, pour ajouter une sortie VGA analogique aux cartes mères (c'était le cas de nos Z170-A de test) il faut pour les constructeurs rajouter un pont à la sortie d'un brin DDI. Ces derniers sont également un peu plus performants même si nous n'avons pas beaucoup de détails. Ce que l'on sait, c'est qu'en pratique, Intel gère désormais les écrans 4K (jusque 4096x2304) en 60 Hz en DisplayPort 1.2. Intel ne gère par contre pas le 4K 60 Hz en HDMI, on est toujours limité au 24 Hz, en version 1.4b (pas de gestion du HDMI 2.0, certaines cartes mères pourraient rajouter un convertisseur DP vers HDMI 2.0 cependant). Par rapport à la version gérée par Haswell/Broadwell, HDMI 1.4b rajoute la gestion du 1080p 3D 60Hz par œil.

Mise à jour du 21/08/2015 : Lors de l'IDF nous avons pu en apprendre plus, vous trouverez ci-dessous notre actualité publiée à cette occasion pour la partie GPU :

Lors de notre test de Skylake, nous avions pu publier quelques détails sur le fonctionnement de son architecture graphique. L'IDF a cependant été l'occasion d'obtenir quelques précisions supplémentaires que nous allons essayer de vous détailler. En pratique la grande majorité des modifications a surtout un impact sur la consommation, et non sur les performances comme l'ont montrés nos tests pratiques.

Architecture

De haut niveau, la génération graphique 9 de Skylake est assez proche de celle de Broadwell. Comme nous l'indiquions à l'époque on retrouve les mêmes concepts de « slices » et d'EU. C'est à l'intérieur de ces unités que l'on retrouve les changements.

On notera au niveau de la gestion de la géométrie que toute la partie tessellation a été optimisée pour tenter de diminuer au maximum la génération de géométrie inutile (et donc améliorer les performances).

Au niveau du rasterizer on note quelques changements. Côté anti-aliasing un mode MSAA x16 apparait, tandis que les modes inférieurs gagnent en performance et l'on note l'augmentation de la taille du L3 graphique (qui passe de 512 Ko à 768 Ko). La compression ne se limite pas aux buffers de couleurs, mais s'applique également aux Render Target, une compression sans pertes est disponible (jusqu'a un ratio de 2:1) qui permet de réduire l'impact sur la mémoire et le cache. Un changement qui permet de réduire la consommation, et d'augmenter un petit peu les performances.

On notera enfin quelques petits changements qui visent plus précisément l'aspect « compute » avec une amélioration des performance de la gestion de la cohérence du cache et de nouvelles instructions atomiques (pour un élément, a l'inverse des instructions vectorielles qui s'appliquent a plusieurs éléments à la fois).

QuickSync et media

Nous avions dans notre test noté le saut de qualité offert par QuickSync en ce qui concerne l'encodage vidéo H.264. La raison principale de ce changement semble être l'ajout d'une gestion de l'adaptative rate control pour relancer l'encodage de frames jugées comme mal encodées après coup. Au delà de l'amélioration de qualité, nous avons noté que sur les transitions de scènes (hors I-Frame), Broadwell et Skylake se distinguent largement des architectures Intel précédentes, ce qui peut être lié à ce changement.

Cette amélioration nette de la qualité d'encodage n'est cependant pas le seul changement apporté. En pratique le GPU de Skylake inclut trois blocs pour ces traitements, un dédiée à l'encodage/décodage (MFX), un aux traitements vidéos (VQE), et un nouveau bloc pour les conversions de formats vidéo (changement d'espaces de couleur) et de scaling (SFC).

Du côté du MFX la plus grosse nouveauté concerne l'arrivée du décodage et de l'encodage du format H.265/HEVC 8 bit (le profil main). Intel confirme que pour l'instant, le HEVC 10 bit n'est pas décodé par le MFX, une accélération « GPU » est annoncée mais elle n'est pas transparente comme l'accélération DXVA des autres formats. Intel a également ajouté un encodage des formats JPEG et MJPEG, des formats triviaux à encoder pour le processeur, le but étant surtout de réduire la consommation via des unités fixes.

C'est d'ailleurs l'autre nouveauté que l'on retrouve au niveau de l'encodage H.264/AVC, Intel a ajouté des unités fixes pour réaliser un encodage temps réel (FF Mode). Le but de ce mode alternatif est de proposer un encodage d'une qualité un peu inférieure, mais avec un débit et un temps de compression prévisible.

Nous avons pu voir une démo sous Starcraft II, ou l'on pouvait noter une qualité en dessous de ce que l'on obtient via le mode classique, mais tout à fait suffisante pour streamer en temps réel une partie en ligne avec un impact minimal sur la consommation et les performances CPU.

Du côté du VQE, c'est le traitement des formats RAW qui est accéléré avec les opérations de correction de balance des blancs, conversions d'espace colorimétrique et correction de gamma nottament. Des traitements qui peuvent s'appliquer non seulement aux photos, mais également aux vidéos RAW en provenance de DSLR/caméras vidéos 4K.

Enfin, le SFC est une nouveauté, c'est lui qui permet la gestion de ce que Microsoft appelle le mode Multi Plane qui permet d'afficher les vidéos en limitant au maximum les interactions avec la mémoire en accélérant en temps réel les opérations de scaling et conversions de couleurs. Les vidéos décodés sont ainsi adaptées directement à l'écran sans avoir besoin de passer par la mémoire centrale ou un cache pour traitement. Une fonctionnalité qui est également implémentée par AMD dans ses APU Carrizo pour rappel.

Système d'affichage

De ce côté Intel a effectué plusieurs remises à niveau de sa plateforme, en supprimant la liaison FDI entre le CPU et le chipset et en supprimant dans ce dernier la gestion des sorties analogiques VGA. Aujourd'hui, si l'on souhaite ajouter à sa carte mère Skylake une sortie VGA, il faudra rajouter une puce pour convertir le signal numérique en analogique, ce qui explique la rareté des sorties VGA sur beaucoup de cartes mères annoncées par les constructeurs, là ou elles étaient pléthoriques dans les gammes Z87/Z97 !

On retrouve toujours à l'intérieur trois « display pipe » qui peuvent être utilisées en simultané pour gérer jusque trois écrans. En pratique chaque pipe est capable de « composer » les images à partir de plusieurs plans (4 dans Skylake, une nouveauté). Typiquement en plus d'un fond fixe, on peut avoir une ou plusieurs vidéos, ainsi qu'un plan dédié en général à l'affichage du curseur de souris. Les pipes composent ainsi indépendamment jusque trois images. Ces sorties sont enfin multiplexées vers les trois sorties DDI, qui s'occupent de convertir les images générées vers le format de sortie (DisplayPort ou HDMI).

Avec Skylake l'autre nouveauté principale est qu'il est désormais possible d'atteindre le 4K 60 Hz pour les versions desktop. Comme nous l'avions indiqué à l'époque, Intel ne gère pas le HDMI 2.0, même s'il est possible en théorie de convertir la sortie d'un port DP 1.2 vers le HDMI 2.0. Plusieurs cartes mères Z170 avaient été annoncées avec ce support mais comme nous l'avons vu chez Gigabyte, l'annonce de ce support a été retirée des spécifications même si le convertisseur est bien présent sur la carte, sans que l'on sache s'il s'agit d'un problème de firmware ou d'autre chose.

Notez que le support diffère sur les modèles U (15W) et Y (4.5W) ou le constructeur limite la résolution maximale pour limiter la consommation. On note avec attention que certains modes sont autorisés uniquement si l'OEM propose un refroidissement suffisant.

On notera enfin qu'en ce qui concerne l'affichage, Intel a indiqué être prêt à adopter l'extension « adaptive sync » de la norme DisplayPort. Cette extension qui permet de faire varier le taux de rafraichissement à la volée avait été développée pour rappel par AMD. On ne sait pas quand, ni avec quels iGPU l'adaptive sync pourrait être supporté par Intel. Théoriquement le support de la version eDP semble être présent depuis Broadwell mais rien ne dit que cela puisse s'appliquer aux DDI qui gèrent les sorties DP actuellement dans Broadwell et Skylake.