Les contenus liés aux tags Intel et Skylake

Afficher sous forme de : Titre | Flux

Intel annonce aussi les Skylake mobiles

Tags : Intel; Skylake;
Publié le 02/09/2015 à 12:22 par Guillaume Louel

En marge de l'annonce de ses modèles Desktop, Intel a également annoncé sa gamme mobile qui profite de plusieurs changements cette année. Notez cependant qu'à l'image de la plateforme desktop, il s'agit ici d'annonces et non de disponibilité ferme. S'il faudra compter plusieurs semaines pour les premiers modèles, pour d'autres il faudra attendre encore plus longtemps !


Historiquement, Intel compose ses gammes grand public avec deux dies - un modèle double cœur et un modèle quadruple cœur - qui se retrouvaient déclinés côté desktop et mobile avec des fréquences et des TDP différents. Avec l'arrivée de multiples versions des IGP (GT2/GT3/GT4 avec un die d'eDRAM additionnel pour les deux derniers), on retrouve encore plus de configurations différentes, même s'il est difficile de déterminer le nombre exact de dies que produit réellement Intel pour créer l'ensemble de sa gamme. En pratique, on trouve quatre configurations CPU/IGP distinctes qui se répartissent sur quatre TDP mobiles : 4.5, 15, 28 et 45 watts.

 
 

A 45 watts tout d'abord, on retrouvera les modèles mobiles quadruples cœurs, lancés uniquement avec des IGP GT2 (avec 24 EU sans eDRAM). Il s'agit de la même configuration que les processeurs desktop, et de la même manière il faudra utiliser un chipset séries 100 pour les piloter. Intel proposera ultérieurement une version avec IGP GT4e (72 EU et 128 Mo d'eDRAM), possiblement en 2016.

Pour ce qui est annoncé aujourd'hui, on retrouve deux gammes, la gamme Core classique ainsi qu'une gamme Xeon. Cette dernière se distingue par son support de la mémoire ECC et de vPro (qui était déjà supporté sur certains modèles)… et par un prix plus élevé. En pratique il s'agit des mêmes die et l'on cherchera au-delà du prix les différences entre le Core i7 6920HQ et le Xeon E3 1535M v5. Une autre puce se distingue à 45W, le Core i7-6820HK dont le coefficient multiplicateur sera débloqué.

Notez enfin sur le sujet des quad-core que trois références 25 watts sont également présentes sur le site d'Intel, comme les Xeon E3-1505L v5  et Core i7-6822EQ , des puces identiques à l'ECC près qui proposent une fréquence de base de 2.0 GHz et de 2.8 GHz en mode Turbo, ainsi qu'un Core i5-6442EQ  qui perd l'HyperThreading (gamme i5 oblige) et garde des fréquences à 1.9/2.7 GHz. On notera que deux autres modèles 45 watts aux références proches font également partie des références qui apparaissent sur le site du constructeur, Core i7-6820EQ  et Core i5-6440EQ . Dans tous les cas, ces puces restent construites sur la base quad core + GT2, leur disponibilité semble cependant un peu plus lointaine, Intel indiquant simplement le quatrième trimestre sans plus de détails.


En dessous on retrouvera la gamme 28 watts qui si elle est annoncée aujourd'hui, ne sera vraisemblablement disponible que dans un second temps. Quatre modèles U sont annoncés et ils utilisent tous la configuration double cœur + IGP GT3e (48 EU et 64 Mo d'eDRAM), avec des fréquences assez élevées. Une autre différence est qu'à partir de 28 watts et pour tous les modèles suivants, Intel inclut un chipset directement dans le packaging (sur un die séparé).

 
 

A 15 watts, on retrouvera à nouveau deux configurations différentes. D'abord la version double cœur + GT3e, la même configuration qu'a 28W, mais avec des fréquences revues à la baisse. Là encore ces puces ne seront pas disponibles immédiatement. L'autre configuration est plus classique, avec deux cœurs et l'IGP GT2 (24 EU sans eDRAM). On notera que la fréquence de base est réduite sur les modèles GT3e par rapport aux modèles GT2 équivalents, même si les fréquences Turbo sont identiques ou proches. En pratique l'ajout d'un IGP plus gros et de l'eDRAM devrait pousser le package plus rapidement vers sa limite de TDP.


Enfin, on retrouve la configuration 4.5 watts, la gamme Core m qui se retrouve déclinée cette année en m3/m5 et m7. Techniquement, on retrouve le même die que pour les modèles U 15W en GT2, mais avec des fréquences revues fortement à la baisse et une gestion de l'énergie plus agressive. Intel fait tout pour limiter la consommation des plateformes en n'autorisant que la LPDDR3 (ni la DDR3L, ni la DDR4 ne seront autorisées par le constructeur à ses clients OEM).


L'autre différence principale entre les modèles Y et les modèles U concerne le package, largement réduit pour le modèle Y puisqu'Intel a tassé le tout dans un rectangle de 20mm par 16.5 mm !

Globalement la gamme mobile d'Intel propose quelques nouveautés intéressantes, on appréciera l'arrivée des modèles GT4e et GT3e par exemple, même si ces derniers n'arriveront vraisemblablement pas tout de suite. Le flou entretenu par le constructeur sur la disponibilité de ses modèles eDRAM est gênante. La multiplication de la gamme Core m nous laisse de marbre, tout comme ses fréquences turbo fort élevées qui ne seront tenues que de courts instants avant que le TDP soit dépassé et qu'elles ne retombent. Enfin, en ce qui concerne l'arrivée de la gamme Xeon, là aussi on se posera la question de la nécessité de cette segmentation additionnelle pour ce qui n'est au final qu'un support officiel de l'ECC.

Malgré tout, Intel semble avoir travaillé ardemment sur la gestion de l'énergie comme nous le notions durant l'IDF, que ce soit avec la nouvelle gestion des P-States assistée (Speed Shift) ou les diverses améliorations pour améliorer l'efficacité totale du système. Il faudra attendre de voir arriver la nouvelle génération de machines portables sur le marché pour voir si ces nouveautés, en théorie intéressantes, font une différence réelle en pratique.

Intel lance les Skylake desktop i7, i5, i3 et Pentium

Publié le 02/09/2015 à 11:50 par Marc Prieur

C'est finalement aujourd'hui qu'Intel annonce la quasi intégralité de sa gamme Skylake. Sur PC de bureau on trouve, en sus des Core i7-6700K et Core i5-6600K lancés il y a moins d'un mois, des Core i7 et i5 4 cœurs 65 watts et 35 watts (gamme T) qui sont cette-fois bloqués côté overclocking. Si la gamme T profite de quelques centaines de MHz supplémentaires par rapport aux Haswell, pour le reste on a droit à des fréquences et des tarifs globalement identiques.

Seul le Core i5-6400 détonne puisque désormais le 4 cœurs le moins cher (182$) n'est cadencé qu'à 2.7-3.3 GHz contre 3.2-3.4 GHz pour l'i5-4460. Un recul dommageable, on lui préférera plutôt l'i5-6500 qui est à 3.2-3.6 GHz mais 192$.

 
 

La gamme i3 à 2 cœurs et Hyperthreading, déclinée en versions 65 et 35w également, n'a pas de recul de ce type et on démarre dès 3.7 GHz avec l'i3-6100 à 117$. Sur l'i3-6300 on gagne 100 MHz, 1 Mo de cache LLC, et 100 MHz au niveau de l'iGPU pour 21$ supplémentaires. Contrairement à ce qui se passe sur Haswell on dispose semble-t-il d'un iGPU GT2 qui semble complet (24 EUs) sur le premier i3 puisqu'il garde sa dénomination HD Graphics 530. Un i3-6320, permet enfin de passer à 3.9 GHz mais il faudra débourser 149$ ce qui le rends peu intéressant.

 
 

Côté Pentium on dispose dans tous les cas de 3 Mo de cache LLC mais la fréquence passe de 3.3 GHz sur le G4400 à 3.5 GHz sur le G4500 et 3.6 GHz sur le G4520, les tarifs étant de 64, 75 et 86$. A noter que le G4400 est doté d'un HD Graphics 510, probablement un iGPU de type GT1 à 12 EUs. Cette iGPU est également présent sur les Celeron G3920 et G3900 qui se limitent à un cache LLC de 2 Mo et des fréquences de 2.9 et 2.8 GHz. Là encore de base on trouve des versions 65 watts mais il existe aussi une gamme 35 watts en T. Bonne nouvelle les Celeron et Pentium Skylake supportent le VT-d comme l'AES-NI, à l'inverse de leurs prédécesseurs, mais l'AVX reste aux abonnés absents. A noter que si les Celeron sont présent sur le document ci-dessous ils seront en fait lancés plus tard, on ne sait pas exactement à quelle date.

 
 

Ces nouveaux processeurs sont accompagnés d'autres chipsets en sus du Z170 que l'on connait déjà et qui va de pair avec les K pour l'overclocking, mais pas seulement puisqu'Intel indique que les non-K peuvent être overclockés "partiellement" sur Z170. Pour rappel sur Haswell on pouvait en fait pousser le Turbo sur 2/3/4 cœurs à la même fréquence que celui sur 1 cœurs ce qui permettait généralement de gagner 200 MHz (contre 400 MHz sur les Ivy et Sandy Bridge). Reste donc à savoir ce qu'il en est pour Skylake.

En sus des chipsets entreprise Q150 et Q170 on trouve donc les H170, B150 et H110 dans l'ordre décroissant des fonctionnalités. Le H170 perd donc l'overclocking et la possibilité d'utiliser les 16 lignes PCIe du CPU sur plusieurs ports. A son propre niveau le H170 dispose de 24 lignes en sorties contre 26 pour le Z170, il faudra donc faire le choix entre les 6 SATA 6 Gbps, les 8 USB 3.0 et les 16 lignes PCIe Gen3 (contre 6, 10 et 20) puisque cela fait un total de 30. Sur les 16 lignes PCIe on peut utiliser deux ports SATA Express x2 ou M.2 x2/x4, contre 3 sur Z170.

Le B150 descend d'un cran en fonctionnalités puisqu'on perd notamment la gestion du RAID mais aussi celle d'utiliser un SATA Express ou un M.2. Le nombre d'USB 3.0 passe à 6 et les PCIe Gen3 du chipset à 8. Enfin sur H110 les ports PCIe du chipsets ne sont plus que 6 et sont en Gen2, alors qu'on dispose de 4 USB 3.0 et de 4 SATA 6G.

On finira cette longue actualité par une information des plus importantes puisque si Intel avait décalé le lancement des K et du Z170 pour le synchroniser avec la Gamescom, cette-fois le lancement du reste de la gamme Skylake est avancé pour l'IFA. La disponibilité réelle de ces i7, i5, i3 et Pentium n'est pour sa part pas attendue avant la fin septembre ! Après le "reverse paper launch" d'août (disponibilité sans informations techniques), on a donc droit cette fois à un vrai paper launch, soit des produits annoncés qui ne seront pas disponibles avant plusieurs semaines. Mais que se passe-t-il chez le géant de Santa Clara ?

IDF: L'architecture GPU de Skylake

Publié le 21/08/2015 à 03:13 par Guillaume Louel

Lors de notre test de Skylake, nous avions pu publier quelques détails sur le fonctionnement de son architecture graphique. L'IDF a cependant été l'occasion d'obtenir quelques précisions supplémentaires que nous allons essayer de vous détailler. En pratique la grande majorité des modifications a surtout un impact sur la consommation, et non sur les performances comme l'ont montrés nos tests pratiques.

Architecture

De haut niveau, la génération graphique 9 de Skylake est assez proche de celle de Broadwell. Comme nous l'indiquions à l'époque on retrouve les mêmes concepts de « slices » et d'EU. C'est à l'intérieur de ces unités que l'on retrouve les changements.

On notera au niveau de la gestion de la géométrie que toute la partie tessellation a été optimisée pour tenter de diminuer au maximum la génération de géométrie inutile (et donc améliorer les performances).

 
 

Au niveau du rasterizer on note quelques changements. Côté anti-aliasing un mode MSAA x16 apparait, tandis que les modes inférieurs gagnent en performance et l'on note l'augmentation de la taille du L3 graphique (qui passe de 512 Ko à 768 Ko). La compression ne se limite pas aux buffers de couleurs, mais s'applique également aux Render Target, une compression sans pertes est disponible (jusqu'a un ratio de 2:1) qui permet de réduire l'impact sur la mémoire et le cache. Un changement qui permet de réduire la consommation, et d'augmenter un petit peu les performances.

On notera enfin quelques petits changements qui visent plus précisément l'aspect « compute » avec une amélioration des performance de la gestion de la cohérence du cache et de nouvelles instructions atomiques (pour un élément, a l'inverse des instructions vectorielles qui s'appliquent a plusieurs éléments à la fois).

QuickSync et media

Nous avions dans notre test noté le saut de qualité offert par QuickSync en ce qui concerne l'encodage vidéo H.264. La raison principale de ce changement semble être l'ajout d'une gestion de l'adaptative rate control pour relancer l'encodage de frames jugées comme mal encodées après coup. Au delà de l'amélioration de qualité, nous avons noté que sur les transitions de scènes (hors I-Frame), Broadwell et Skylake se distinguent largement des architectures Intel précédentes, ce qui peut être lié à ce changement.

 
 

Cette amélioration nette de la qualité d'encodage n'est cependant pas le seul changement apporté. En pratique le GPU de Skylake inclut trois blocs pour ces traitements, un dédiée à l'encodage/décodage (MFX), un aux traitements vidéos (VQE), et un nouveau bloc pour les conversions de formats vidéo (changement d'espaces de couleur) et de scaling (SFC).

Du côté du MFX la plus grosse nouveauté concerne l'arrivée du décodage et de l'encodage du format H.265/HEVC 8 bit (le profil main). Intel confirme que pour l'instant, le HEVC 10 bit n'est pas décodé par le MFX, une accélération « GPU » est annoncée mais elle n'est pas transparente comme l'accélération DXVA des autres formats. Intel a également ajouté un encodage des formats JPEG et MJPEG, des formats triviaux à encoder pour le processeur, le but étant surtout de réduire la consommation via des unités fixes.


C'est d'ailleurs l'autre nouveauté que l'on retrouve au niveau de l'encodage H.264/AVC, Intel a ajouté des unités fixes pour réaliser un encodage temps réel (FF Mode). Le but de ce mode alternatif est de proposer un encodage d'une qualité un peu inférieure, mais avec un débit et un temps de compression prévisible.

 
 

Nous avons pu voir une démo sous Starcraft II, ou l'on pouvait noter une qualité en dessous de ce que l'on obtient via le mode classique, mais tout à fait suffisante pour streamer en temps réel une partie en ligne avec un impact minimal sur la consommation et les performances CPU.

Du côté du VQE, c'est le traitement des formats RAW qui est accéléré avec les opérations de correction de balance des blancs, conversions d'espace colorimétrique et correction de gamma nottament. Des traitements qui peuvent s'appliquer non seulement aux photos, mais également aux vidéos RAW en provenance de DSLR/caméras vidéos 4K.

 
 

Enfin, le SFC est une nouveauté, c'est lui qui permet la gestion de ce que Microsoft appelle le mode Multi Plane qui permet d'afficher les vidéos en limitant au maximum les interactions avec la mémoire en accélérant en temps réel les opérations de scaling et conversions de couleurs. Les vidéos décodés sont ainsi adaptées directement à l'écran sans avoir besoin de passer par la mémoire centrale ou un cache pour traitement. Une fonctionnalité qui est également implémentée par AMD dans ses APU Carrizo pour rappel.

Système d'affichage

De ce côté Intel a effectué plusieurs remises à niveau de sa plateforme, en supprimant la liaison FDI entre le CPU et le chipset et en supprimant dans ce dernier la gestion des sorties analogiques VGA. Aujourd'hui, si l'on souhaite ajouter à sa carte mère Skylake une sortie VGA, il faudra rajouter une puce pour convertir le signal numérique en analogique, ce qui explique la rareté des sorties VGA sur beaucoup de cartes mères annoncées par les constructeurs, là ou elles étaient pléthoriques dans les gammes Z87/Z97 !

On retrouve toujours à l'intérieur trois « display pipe » qui peuvent être utilisées en simultané pour gérer jusque trois écrans. En pratique chaque pipe est capable de « composer » les images à partir de plusieurs plans (4 dans Skylake, une nouveauté). Typiquement en plus d'un fond fixe, on peut avoir une ou plusieurs vidéos, ainsi qu'un plan dédié en général à l'affichage du curseur de souris. Les pipes composent ainsi indépendamment jusque trois images. Ces sorties sont enfin multiplexées vers les trois sorties DDI, qui s'occupent de convertir les images générées vers le format de sortie (DisplayPort ou HDMI).

 
 

Avec Skylake l'autre nouveauté principale est qu'il est désormais possible d'atteindre le 4K 60 Hz pour les versions desktop. Comme nous l'avions indiqué à l'époque, Intel ne gère pas le HDMI 2.0, même s'il est possible en théorie de convertir la sortie d'un port DP 1.2 vers le HDMI 2.0. Plusieurs cartes mères Z170 avaient été annoncées avec ce support mais comme nous l'avons vu chez Gigabyte, l'annonce de ce support a été retirée des spécifications même si le convertisseur est bien présent sur la carte, sans que l'on sache s'il s'agit d'un problème de firmware ou d'autre chose.


Notez que le support diffère sur les modèles U (15W) et Y (4.5W) ou le constructeur limite la résolution maximale pour limiter la consommation. On note avec attention que certains modes sont autorisés uniquement si l'OEM propose un refroidissement suffisant.

 
 

On notera enfin qu'en ce qui concerne l'affichage, Intel a indiqué être prêt à adopter l'extension « adaptive sync » de la norme DisplayPort. Cette extension qui permet de faire varier le taux de rafraichissement à la volée avait été développée pour rappel par AMD. On ne sait pas quand, ni avec quels iGPU l'adaptive sync pourrait être supporté par Intel. Théoriquement le support de la version eDP semble être présent depuis Broadwell mais rien ne dit que cela puisse s'appliquer aux DDI qui gèrent les sorties DP actuellement dans Broadwell et Skylake.

IDF: Support de la mémoire DDR3 sur Skylake

Publié le 20/08/2015 à 00:05 par Guillaume Louel

Lors d'une session sur la mémoire, Intel est revenu sur la question du support de la mémoire DDR3 traditionnelle. Pour rappel, Intel indique sur son site que les processeurs Skylake, dans le cas de l'utilisation d'une carte mère DDR3, ne supportent que la mémoire DDR3L (avec une tension de 1.35V).


Officiellement Intel nous a confirmé que Skylake ne supporte pas directement la mémoire DDR3 classique à 1.5V, cependant il est possible de modifier les cartes mères pour pouvoir supporter une tension de 1.5V ou supérieure, ce que semblent faire la majorité des constructeurs via une modification du BIOS.

Avec le passage au 14nm, les tensions à l'intérieur du processeur sont en baisse ce qui pose un problème pour le contrôleur mémoire. En pratique Intel ne valide pas l'utilisation de tensions mémoires au delà de 1.35V pour la DDR3 même si cela ne semble pas poser de problème majeur à l'usage. Selon notre interlocuteur il peut effectivement y avoir un risque (léger) pour le processeur ce qui pousse Intel a ne pas valider de tensions au delà de 1.35V.

Malgré tout les constructeurs de cartes mères "prennent le risque" en effectuant eux même la modification. Pour être complet, sachez que nous avons réalisés des tests CPU et GPU en DDR3 dansnotre article Skylake avec de la mémoire alimentée en 1.5V et même 1.65V sans le moindre problème. Il est cependant possible que certains modèles de cartes mères Skylake DDR3 se limitent à un support officiel en bloquant la tension, un point que nous essayerons d'éclaircir auprès des fabricants de cartes mères.

IDF: L'architecture CPU Skylake en détails !

Publié le 19/08/2015 à 16:40 par Guillaume Louel


Enfin ! Comme promis, Intel profite de l'IDF pour commencer a parler des détails de l'architecture de Skylake au travers de plusieurs sessions qui ont eu lieu en cette première journée. Nous avons tenté de regrouper le maximum d'informations dans cette longue actualité, en sachant que le constructeur tend a lâcher au compte goutte les détails d'une session à l'autre, il n'est pas impossible que certains détails ne soient dévoilés que dans les jours à venir ! Nous allons tenter de noter les différences par rapport à Haswell, vous pouvez vous rafraichir la mémoire en relisant notre article.

 
 

Avant de commencer, on notera que le constructeur travaille sur Skylake depuis plusieurs années (plus de 5) et que le projet, réalisé en Israel (Intel alterne deux équipes, une en Israel, l'autre dans l'Oregon) aura été modifié plusieurs fois pour rajouter successivement des TDP de 15 watts (avec les Ultrabook lancés à partir de 2008) puis de 4.5W (Core M) ainsi que des variations de packaging. On notera aussi, et c'est une première, que les détails que nous indiquons en dessous ne concernent que la version grand public de Skylake. La version serveur profitera de choix différents au niveau de l'architecture, on sait par exemple que seule la version serveur de Skylake supportera l'AVX512, mais les différences devraient être plus larges.

Frontend, scheduler et unités d'execution

Dans les grandes lignes on ne notera pas de changement majeur sur le frontend qui reste de type 4-way (jusque 4 instructions x86 décodées en simultanées) comme pour Sandy Bridge et Haswell. En pratique de ces quatre instructions CISC, jusque 6 micro-ops (les instructions RISC) peuvent toujours être générées.

En amont du décodage, on retrouve la prédiction de branchement qui évolue par contre significativement. Intel ne rentre pas dans les détails de l'algorithme mais indique qu'il est plus intelligent et capable de considérer des branchements beaucoup plus longs qu'auparavant. De la même manière, Intel a augmenté la taille des différents buffers durant les différentes étapes du front-end, un changement que l'on retrouve a presque toutes les nouvelles architectures.

Les micro-ops décodées sont en effet stockées dans deux files capables d'en stocker 64 par thread (contre un buffer unique de 56 pour Haswell), un changement majeur qui permet au scheduler de tenter d'extraire un maximum de parallélisme.

Le scheduler a pour but de dispatcher les micro-ops vers les unités d'exécution. Il profite des files rallongées et de certains changements au niveau de ses algorithmes dans la gestion de l'hyperthreading.

 
 

Le point le plus flou pour l'instant concerne les unités d'exécution. Pour rappel, avec Haswell on disposait de 8 ports sur lesquels étaient répartis de multiples unités d'exécution (ALU pour les instructions sur les entiers, des unités AVX/flottants, les chargements/sauvegardes de données en mémoire, les branchements…). Pour l'instant tout ce que l'on sait, c'est que le nombre d'unités a augmenté sans savoir celles qui ont été ajoutées. Deux autres détails ont été donnés par les ingénieurs d'Intel : l'unité en charge des divisions gagne en flexibilité, tandis que la latence de traitement de certaines instructions FPU serait en baisse. Intel nous a promis que nous aurions plus de détails sur ces points dans une session à venir.

Globalement les changements sont intéressants dans le sens ou ils permettent en théorie de maximiser un peu plus l'utilisation des unités d'exécution de chaque coeur, ce qui peut se traduire dans certains cas par une augmentation importante des performances. Le constructeur a par ce biais réussi à améliorer significativement ses résultats dans un des benchmarks SPEC sur un coeur (ce qui a valu à nos confrères allemands de ressortir la rumeur - évidemment fausse - d'un hyperthreading inversé en fin de semaine dernière !). Les changements restent cependant très localisés et dans l'absolu, Intel continue d'affiner les grandes lignes d'une architecture Core, certes excellente, mais qui reste la même dans les grandes lignes depuis des années.

Jeu d'instruction

Lors de notre test de Skylake, nous avions noté la présence d'une nouveauté dans le jeu d'instruction : MPX, Memory Protection Extension. Ces instructions permettent de rajouter des vérifications sur les adresses mémoires accessibles pour éviter les attaques type buffer overflow et empêcher un processus d'accéder a de la mémoire a laquelle il n'a pas droit. Nous n'avons pas encore obtenu plus de détail sur ces instructions.

 
 

Par contre, une autre nouveauté complémentaire concerne ce que le constructeur appelle SGX, pour Software Guard Extension. Ces instructions permettent de créer des zones mémoires protégées qui ne sont accessibles qu'au processus qui les a crée, et qui, dans le cas ou les données auraient été tout de même corrompues, couperait le fonctionnement du process concerné afin de maximiser sa sécurité. De la même manière, l'utilisation d'une zone mémoire sécurisée (Secure Enclave) désactive toutes les possibilités de deboguage sur le système.

 
 

Si l'on imagine aisément l'utilité de ces extensions dans certaines situations dans le monde de l'entreprise, d'un point de vue grand public on pensera surtout aux implémentations éventuelles de DRM qui pourraient utiliser ces technologies à l'avenir.

Gestion de l'alimentation

Un gros travail a également été réalisé sur la gestion de l'alimentation avec un usage accru du power gating de certaines unités gourmandes, c'est notamment le cas des unités AVX2 qui sont éteintes lorsqu'elles ne sont pas sollicitées. Des économies ont été réalisées à tout les niveaux, particulièrement celui des interconnexions et des I/O pour limiter au maximum la consommation.

Les ingénieurs ont travaillé plus spécifiquement sur les scénarios idle ou « presque » idle comme la lecture vidéo pour augmenter au maximum la longévité de la batterie en usage mobile. Parmi les solutions retenues pour arriver à ce but, on retrouve l'ajout de domaines d'horloges séparés pour le System Agent, le contrôleur mémoire et l'I/O eDRAM (pour les modèles qui en sont pourvus).

Un travail important a également été réalisé sur l'unité de gestion de l'énergie (Power Control Unit) pour la rendre un peu plus intelligente dans de multiples scénarios ou elle devient capable d'estimer un risque de throttling et de réduire a l'avance la fréquence pour éviter d'atteindre la température maximale à laquelle un throttling sévère est inéluctable.

 
 

L'autre choix concerne l'utilisation du Duty Cycle Control en lieu et place d'un changement de fréquence. Comme indiqué par Intel, réduire la fréquence (via les P-States pour les coeurs) permet de diminuer la consommation de manière linéaire, et il est souvent plus efficace d'éteindre et d'allumer (un peu a la manière d'un contrôleur PWM) les unités tout en gardant une fréquence plus élevée.

Speed Shift

L'autre changement majeur concernant la PCU est ce qu'Intel appelle Speed Shift, un changement fondamental du fonctionnement des P-States. Pour rappel, la fréquence du processeur est gérée à la fois par le processeur lui même et le système d'exploitation. Le processeur propose une table dite de P-States (via les tables ACPI) qui indique les différents couples de tensions/fréquences qu'il peut utiliser.

 
 

Dans un fonctionnement classique, le système d'exploitation, en fonction de la charge qu'il traite, va contrôler explicitement les changements de P-States (ce qui requiert une latence d'environ 30ms selon Intel) en choisissant un niveau (par exemple, P1, la fréquence maximale « non turbo »). Il y a cependant - chez Intel - deux exceptions à cette règle. La première concerne les fréquences Turbo qui varient en fonction du nombre de coeurs actifs. Cette gestion s'effectue directement par le processeur. L'autre est le cas du throttle lorsque l'on dépasse la température de fonctionnement critique. Dans ce cas le processeur effectue seul (heureusement !) le throttling en passant dans les modes dits de contrôle thermique.

L'idée de Speed Shift est de changer la relation entre le système d'exploitation et le processeur. D'une, avec Speed Shift le processeur expose désormais la totalité des fréquences disponibles, y compris les modes Turbo gérés jusqu'ici de manière transparente. Ensuite, le système d'exploitation va donner une sorte d'indication globale pour indiquer s'il faut privilégier la performance ou l'économie d'énergie (remplaçant le concept des modes performance/balanced/etc que l'on retrouvait par exemple sous Windows 7, ainsi que le mode batterie/alimentation pour les portables). Enfin, par défaut le PCU est capable de gérer tout seul les P-States en choisissant automatiquement le mode qui semble le plus adapté à la volée et de manière complètement autonome.

Par dessus ceci, le système d'exploitation peut décider d'intervenir, mais cela se fait d'une manière nouvelle. En effet, le système définit une fréquence minimale ainsi qu'une fréquence maximale, laissant là encore au PCU une marge de manoeuvre pour optimiser automatiquement au mieux en fonction de la charge. Il est également possible de demander une fréquence précise, de manière optionnelle, mais cela se fait en plus des fréquences mini et maxi et n'est en rien garanti.

 
 

Intel implémente des algorithmes avancés dans son PCU qui tentent d'estimer en permanence s'il est plus intéressant de limiter la fréquence dans le cas d'une charge légère constante, ou au contraire de pousser la fréquence pour pouvoir éteindre le plus rapidement possible les unités et sauver de l'énergie au final.

 
 

L'algorithme du PCU tente également de détecter les situations ou l'on interagit avec le système pour améliorer le côté responsif du système. L'idée de base telle que voulue par les concepteurs du système était de passer le plus rapidement possible en mode turbo lorsque l'on détecte une interaction (réveil, souris, etc) pour donner l'impression que le système est plus réactif. En pratique le PCU tente de détecter les charges typiques d'une interaction et utilise plusieurs systèmes pour filtrer des charges plus longues (lecture vidéo), ou tellement courtes qu'elles ne mériteraient pas que la fréquence augmente.


En pratique en tout cas,Intel indique être capable de réduire à la fois la consommation tout en ne sacrifiant pas sur les performances. Vous pouvez voir sur ce slide quelques résultats annoncés par le constructeur même s'il n'est pas rentré plus dans les détails !

Speed Shift changeant fondamentalement le mode d'interaction entre le processeur et système d'exploitation, on ne sera pas surpris d'apprendre que son support doit être explicite, et est donc aujourd'hui limité. Aujourd'hui, seul Windows 10 est capable de l'exploiter. Sur tous les autres OS, le fonctionnement reste à l'ancienne.

Il est intriguant de voir qu'Intel n'a pas encore publié de patch pour Linux pour y ajouter le support de Speed Shift. D'autres technologies de Skylake comme MPX ont en effet eu droit à un support dès janvier sous Linux. Malgré tout, l'idée de rénover le concept fort vieux des P-States est une excellente idée, laisser la main au processeur sur sa fréquence parait presque une évidence et il sera très intéressant de voir l'impact pratique qu'aura cette technologie sur la conservation de la batterie sur les versions mobiles de Skylake.



eDRAM, IVR, Chipset

Un autre changement important concerne la manière dont la mémoire eDRAM est interfacée avec le processeur. Avec Broadwell par exemple, l'eDRAM est interfacée derrière le cache LLC et peut contenir de la mémoire utilisée par l'IGP ou par les coeurs mémoires (des tags dans le LLC marquent qui utilise quoi).

 
 

Avec Skylake l'eDRAM se retrouve placée entre le LLC et le contrôleur mémoire, s'intégrant de manière encore plus transparente dans la hiérarchie mémoire. En pratique ce changement permet de mettre en cache des données qui peuvent venir d'un peu partout. Le L4 peut ainsi contenir en cache des requêtes PCI Express ou du chipset.

Cette transparence est cependant débrayable dans le cadre d'une utilisation graphique. Le pilote graphique Intel dispose d'un mode d'accès spécifique qui lui permet de demander où il souhaite que soit mises en cache certaines informations. Il peut demander a ce que des informations soient stockées dans le L3, ou dans l'eDRAM au choix, ou au contraire nulle part. Des décisions que le pilote, selon Intel, est plus a même d'estimer correctement. L'impact réel de ce changement est difficile à évaluer même si potentiellement il devrait profiter aux utilisations non graphiques.

On notera sur la question de la suppression du régulateur de tension intégrée que les ingénieurs nous ont donné une réponse : la décision de les supprimer a été prise spécifiquement à cause des modèles 4.5W ou l'IVR était inefficace. Une « meilleure » solution, s'ils avaient eu plus de temps selon les ingénieurs d'Intel aurait été de supprimer l'IVR uniquement sur les modèles basse consommation et de les garder sur les autres. Un sous-entendu qui laisse penser que le constructeur pourrait opter pour cette séparation a l'avenir pour Cannonlake.


Notons pour terminer que le chipset, au delà des changements déjà évoqués dans notre article, propose une particularité originale : il est désormais capable d'entrer en mode throttling en cas de surchauffe. L'idée est surtout d'éviter la situation ou, a cause d'une surchauffe de la plateforme, le PCH pourrait mettre en péril le système. Intel gagne surtout un peu de marge pour les puces 4.5 et 15W qui incluent dans le package le PCH, jusque à côté du die cpu/graphique.

Top articles