Sound Blaster Audigy 4 Pro

Publié le 30/03/2005 par
Imprimer
Le son haute résolution : pourquoi et comment ?
Depuis la sortie de l’Audigy première du nom et de ses soit disants 24 bits, le monde de l’audio sur PC pour le grand public n’a cessé la surenchère. On nous vendait du GHz au kilo pour les processeurs, de la bande passante en Go/s et des pipelines à l’unité pour les cartes 3D, pourquoi ne pas nous vendre aussi quelques bits et quelques dizaines de KHz supplémentaires pour vanter les mérites indicibles des nouvelles solutions audio ? Les utilisateurs savent tous qu’un bus mémoire d’une largeur de 64 bits est mieux qu’un autre d’une largeur de 32 bits, de même, les graphismes en 32 bits sont meilleurs qu’en 16 bits. De là à appliquer ce principe au monde de l’audio, il n’y avait qu’un pas, et les constructeurs viennent de le franchir allégrement. Mais cette multiplication des bits et des KHz a t’elle le moindre intérêt pour l’utilisateur de PC moyen qui va écouter de la musique, jouer, regarder un DVD Video et, au pire, s’essayer un peu à la création audio ?

Pour le savoir, il convient tout d’abord de revenir à la source et d’expliquer en quoi consistent ces nombres.

Pour commencer, lorsqu’un signal est numérisé il apparaît sous forme d’onde, comme ceci au convertisseur :


Pour être numérisée, cette onde va être décomposée en une série de périodes : elle va être échantillonnée. Cette échantillonnage est plus ou moins dense en fonction du taux choisi : 22 000 échantillons par seconde à 22 KHz ou 96 000 à 96 KHz par exemple. L’onde sonore est donc décomposée comme ce schéma le montre d’une façon volontairement grossière :


La numérisation va donc effectuer un découpage de la courbe en un nombre de points précis qui va déterminer la suite des opérations :


Une fois le découpage signal par signal effectué, on attribue une valeur à chaque signal. C’est là qu’intervient la résolution : en 16 bits cette valeur varie entre 0 et 65535 (en réalité en audio entre -32768 et +32767) et en 24 bits entre 0 et 16 777 215 (en réalité entre – 8 388 608 et + 8 388 607). Lorsqu’un signal ne correspond pas à un entier, le convertisseur arrondit à l’entier le plus proche. Chaque arrondit induit donc une erreur, ou une déformation, par rapport au signal au original. Ce sont ces erreurs que l’on nomme quantization, ou quantification en français.


Une fois les valeurs attribuées, la courbe est reconstituée par le biais d’un filtre de reconstruction. Lors de cette reconstruction, le convertisseur applique un low pass filter qui va éliminer les plus hautes fréquences, génératrices d’erreurs par excellence. Plus le nombre de valeurs précédemment arrondies est grand, plus on devra éliminer de hautes fréquences.


Le nombre de valeurs arrondies, et donc « d’erreurs », est directement lié au taux d’échantillonnage choisi. On comprend donc que théoriquement, plus on rajoute d’intervalles dans la numérisation, plus la courbe reconstituée a de chances d’être fidèle à l’original. De même, le large panel offert par les 24 bits pour attribuer des valeurs augmente également ces chances. Reste que pour pouvoir profiter de cette profusion de nuances, il faut posséder non seulement une oreille exercée, mais également un matériel de restitution performant et silencieux, ce qui est rarement le cas sur PC. De plus, nos cartes son ont beau supporter de telles résolution et de tels taux d’échantillonnage, la quantité de contenu qui nous permet d’en profiter reste bien maigre. On trouve ainsi des DVD Audio qui possèdent des pistes DTS ou MLP en 24 / 96 KHz ou encore Stéréo HD en 24 / 192 KHz mais ce genre d’utilisation reste plus que confidentiel sur PC.

Pour contrer cet argument, certains constructeurs mettent en avant le fait que le support du son 24/192 permet également d’améliorer la qualité de restitution en 16/44.1. En effet, dans son théorème, Shannon  a ainsi déterminé que la plus haute fréquence représentable est égale à la moitié de la fréquence d’échantillonnage. Par exemple, avec un taux d’échantillonnage de 96 KHz la plus haute fréquence représentable est 48 KHz. C’est ce que l’on appelle la fréquence de Nyquist . Notez bien ici la différence entre le taux d’échantillonnage (96 KHz) et la fréquence sonore maximum « numérisable » (48 KHz), toutes deux exprimées avec la même unité mais ne représentant pas la même chose.

Si l’on suit cette logique, sans remettre en cause le couple Shannon/Nyquist bien évidemment, avec un taux d’échantillonnage de 48 KHz maximum tel qu’on le rencontrait jusqu’à présent nous étions limités à une fréquence de 24 KHz. Grâce au 96 KHz généralisé aujourd’hui y compris sur les chipsets intégrés, on peut atteindre des hautes fréquences de 48 KHz. Sachant que l’oreille d’un humain adulte utilise une bande passante allant de 20 Hz à environ 17 KHz (par curiosité, vous pouvez écouter ici un fichier contenant une onde à 15 KHz) et que nos enceintes ont-elles même une bande passante de 40 Hz à 20 KHz pour les meilleures d’entre elles, on peut se demander quel est l’intérêt d’une telle fréquence lors de l’étape de la reproduction.

On peut par contre apprécier le gain théorique d’étendue dynamique (dynamic range en anglais) offert dans l’absolu par le son haute définition. Le son 16 bits / 44.1 KHz est en effet limité à 96 dB alors que le 24 bits permet d’atteindre 144 dB d’étendue dynamique. Représentant la différence entre le niveau le plus possible et le plus bas possibles représentables, cette valeur influe directement sur la qualité du son.

Enfin, il ne s’agit pas ici de nier en bloc l’intérêt du son 24 bits / 192 KHz dans intégralité et pour tous les types d’utilisation. Là ou l’augmentation de la résolution et du taux d’échantillonnage sont intéressants, c’est lors de l’enregistrement et du traitement du son, et non pas pour sa reproduction. En effet, les ré échantillonnages sont délicats lorsque l’on travaille des sinusoïdes proches de la fréquence maximum atteignable (22.05 Khz en 44.1 KHz par exemple). L’intérêt de travailler en haute résolution et en 96 ou 192 KHz est alors évident car il permet de ne pas dénaturer les hautes fréquences et permet une application des effets plus subtile. Mais rien n’empêche par la suite de resampler le résultat final en 44.1 KHz une fois la numérisation et le traitement terminé. Peu de personnes sont en effet capables de faire la différence entre deux sons ayant une source commune en 24 bits / 192 KHz, l’un tel quel et l’autre resamplé en 16 bits /44.1 KHz.

Pour terminer, on peut donc en conclure que pour la majorité des utilisations PC, le son 24 bits / 192 KHz demeure pour l’instant un pur argument marketing. Dans l’immédiat, cette possibilité peut intéresser ceux qui désirent faire de la création audio mais ces derniers se tourneront certainement vers des cartes plus orientées pro et moins polyvalentes comme ce que peuvent proposer EMU, Cream ou Lynx par exemple.
Vos réactions

Top articles