Le futur de l'enregistrement : le 1-Bit.

Korg a développé une nouvelle gamme d'enregistreur utilisant la technologie 1-bit. Le MR-1 modèle compact au format d'enregistrement / lecture 1-Bit à 2,8 MHz, et le MR-1000 un modèle demi-rack au format d'enregistrement / lecture 1-Bit à 5,6 MHz doublant ainsi le standard du format DSD. Ces deux produits sont vendus avec un logiciel exclusif AudioGate(tm) de Korg permettant une compatibilité totale entre l'enregistrement 1-Bit et tout autre format courant d'enregistrement numérique jusqu'au 24 bit à 192 kHz.

Afin de mieux comprendre ce format d'enregistrement 1-Bit, nous avons réalisé ci-dessous, un dossier vous décrivant les techniques sonores numériques actuelles, les avantages et la fidélité de l'enregistrement 1-Bit.

La capture audio en 1-Bit à 5,6MHz permet un archivage audio au plus haut niveau de qualité et permet une conversion des enregistrements archivés dans n'importe quels types de format actuels tout en préservant les fichiers originaux au format 1-Bit.

Le format d'enregistrement 1-Bit n'est pas nouveau dans le monde professionnel de l'audio. Il a été initialement développé par Dr. Yoshio Yamasaki vers la fin des années 80 à l'université de Waseda au Japon. M.Yamasaki a breveté le système et rédigé l'histoire de ces recherches sur le 1-Bit en 1992. La technologie a été ensuite adoptée et utilisée par Sony et Phillips en tant qu'enregistrement DSD (Direct Stream Digital) sous l'appellation SACD, et des produits (DVD AUDIO & CD) sont maintenant disponibles dans le commerce depuis 1999 avec plus de 4000 titres disponibles.



Brève histoire sur l'audio numérique.

Dans les systèmes d'enregistrements analogiques traditionnels, la reproduction, la fidélité et le rendement dynamiques étaient limités par rapport au type de support physique utilisé (bandes, vinyle, etc.). Chaque passage d'une bande à travers les têtes et le cabestan, ou chaque fois que l'aiguille de la cellule passait sur le vinyle, l'enregistrement original se dégradait par le contact mécanique.
Les bandes et le vinyle devaient être enregistrés dans un environnement spécifique, et l'enregistrement sur bande devait être exempt de champs magnétiques tels que des enceintes ou des écrans d'ordinateur. Ces formats de stockage étaient onéreux, limités et se dégradaient rapidement.




L'ère de la numérisation

En automne 1982 (printemps 1983 aux Etats-Unis), le disque compact au format d'enregistrement numérique a été présenté au marché des consommateurs. Ce format numérique offre un certain nombre d'améliorations par rapport aux systèmes analogiques, notamment une fidélité plus élevée, un rendement dynamique accru grâce à une reproduction non mécanique et une plus grandes capacités de mémoire et d'archivage.

Comment fonctionne l'acoustique numérique ?
Fondamentalement, pour analyser numériquement une forme d'onde sonore continue échantillonnée en données numériques à intervalles définis, nous nous référons sur la fréquence d'échantillonnage et sur la quantification du bit.

Graph11

Dans l'exemple ci-dessus, les points bleus représentent les points témoin pris de ce signal audio. Les lignes verticales représentent la fréquence ou le taux d'échantillonnage. Ceci est défini en hertz, représentant combien « d'échantillons » sont pris par seconde. Les traits horizontaux représentent la résolution ou la quantification du bit. La première chose que vous noterez est que les points ne représentent pas exactement le signal initial. C'est parce que la résolution dans cet exemple est assez basse.

Le CD que nous avons échantillonné a été enregistré en utilisant une quantification de 16 à une fréquence d'échantillonnage de 44.1 kilohertz (généralement appelés en 16 bits/44.1 kilohertz). Avant que nous allions plus loin, regardons pourquoi ces numéros ont été choisis. L'oreille humaine répond aux signaux audio s'étendant de 20 hertz (vingt cycles par seconde) à 20 kilohertz (vingt milles cycles par seconde). Les recherches ont montré que pour faire une capture correcte, la fréquence d'échantillonnage doit être légèrement supérieur au double de la fréquence de la source échantillonnée. Ceci s'appelle souvent le théorème de « Nyquist ».

Dans le graphique ci-dessous, la fréquence d'échantillonnage est seulement de 30 kilohertz, alors que la fréquence du signal audio est de 20 kilohertz. La ligne pointillée montre le signal créé de l'erreur de prélèvement. Ces erreurs sont désignées sous le nom d' « Aliasing ».

Graph2

Comme nous avons mentionné, la plage de fréquences comme la gamme dynamique de reproduction avaient été conçues en fonction des limites d'audition de l'oreille humaine de 20Hz à 20kHz et le théorème de « Nyquist » prouve que nous devons échantillonner à une fréquence légèrement le double de la fréquence de la source. En conséquence le CD Audio utilise un format d'échantillonnage de 44,1 kHz avec une quantification sur 16 bits pour l'enregistrement et la reproduction de données numériques.

Fréquence d'échantillonnage : Elle détermine en partie la qualité du son en définissant le nombre de paquets d'informations sonores retenus par seconde et est en partie liée à la réponse en fréquence d'un appareil numérique. Ainsi dans le cas d'un disque compact par exemple, chaque seconde de son est représentée par 44100 (44.1k) échantillons.

Quantification : C'est le terme utilisé pour définir la taille de l'échantillon sonore, c'est-à-dire la quantité d'information qui se retrouve dans chaque échantillon. Définie par le nombre de "bits", la quantification est associée à la dynamique du son numérique. On attribue normalement 6 dB de dynamique par bit de quantification. Le disque compact et le DAT ont tous deux une quantification de 16 bits leur donnant une dynamique théorique de 96 dB.
En conséquence, la quantification de 16 bits représente une augmentation significative par rapport aux medias analogiques d'enregistrement qui étaient en général de 50 à 60 dB.

La technologie du Multi-Bit
Dès que le CD a été présenté, des nouveaux formats d'enregistrement ont commencé à proliférer, avec des fréquences d'échantillonnage et des quantifications plus élevées. On pourrait supposer que des fréquences d'échantillonnage plus élevées couplées à une quantification accrue amélioreraient la qualité de l'enregistrement. Après un nombre important d'essai, l'augmentation de 16 à 24 bits offre un intervalle dynamique approximatif de 110dB, soit une augmentation réduite en comparaison avec le 16 bits. De ce fait, chaque fois que l'on augmente la quantification du bit, l'intervalle dynamique augmentera de moins en moins chaque fois.

La quantification du son
• Distribué également dans la bande entière (bruit blanc)
• Réduit en augmentant la résolution du bit
Il n'y a aucun doute que l'actuel 24/192 kilohertz est excellent. Mais il y a encore des zones qui peuvent être améliorées, et approchées dans une perspective différente avec d'autres avantages.

Graph3

Le processus d'encodage du PCM en Multi-Bit

Graph4

• Avec le son numérique, le signal audio analogique est échantillonné par l'intermédiaire d'un convertisseur et chaque échantillon est converti en un paquet numérique (c'est-à-dire des uns et des zéros). Ce paquet d'information a une taille appelée quantification et que l'on définit par un nombre de "bits". La numérisation du son se fait par l'intermédiaire de convertisseur A/D (analogique à numérique).
• Avant d'être reproduit pour l'écoute, le son numérique doit passer par un convertisseur D/A (numérique à analogique).


Toute transformation du son analogique en informations numériques passe par un convertisseur Analogique/Numérique, pièce maîtresse du système d'enregistrement. Et toute reproduction passe par son inverse, le convertisseur Numérique/Analogique.

Un convertisseur se compose de trois étages électroniques :
1. L'étage d'échantillonnage, qui consiste à prendre des échantillons du son analogique un certain nombre de fois par seconde. Plus le nombre d'échantillons sera grand, plus on sera près de l'original. A titre indicatif, le CD analyse le son 44.100 fois par seconde, le DVD Audio 96.000, alors que le MR-1 l'analyse 2. 822.400 fois et que le MR-1000 l'analyse 5.644.800 fois...

2. L'étage de quantification qui consiste à mesurer la valeur de chaque échantillon, avec une échelle plus ou moins fine. C'est le nombre de "bits":16 bits pour le CD, 24 pour le DVD.

3. L'étage de filtrage pour éviter des recoupements de fréquences et des perturbations dans l'aigu, il est indispensable de supprimer totalement tous les harmoniques supérieurs à la moitié de la fréquence d'échantillonnage, soit 20.000 Hz pour le CD.

Voici les causes des défauts caractéristiques du numérique (PCM) :
Une fréquence d'échantillonnage trop faible, principale cause du manque ressenti à l'écoute du numérique, par rapport à l'analogique.

La quantification (mesure instantanée de l'intensité du son) qui, comme toute mesure, comporte des erreurs : c'est un hasard rarissime si la valeur d'un son à un moment donné est exactement égale à l'une des valeurs préétablies de l'échelle numérique

Le nécessaire mais brutal filtrage des fréquences aiguës qui provoque des rotations de phase et des irrégularités.

Ces défauts sont la cause essentielle de la dureté inhérente au son numérique, et de son espace acoustique étriqué. La détestable mode actuelle, qui consiste à noyer le son dans une réverbération outrancière, au détriment du timbre, a été favorisée par la nécessité d'atténuer cette agressivité sonore, et d'augmenter artificiellement l'espace...

Curieusement, la grande majorité des convertisseurs A/N utilisés dans l'enregistrement PCM conventionnel sont des convertisseurs 1 bit à haute fréquence d'échantillonnage. Généralement, pour créer des signaux PCM, le modulateur Delta Sigma (DS) crée un flux d'impulsion de données à 1 bit qui traverse alors le filtre de décimation, suite à quoi les données sont converties en PCM multi-bits, par réduction de la fréquence d'échantillonnage. On remarque alors que les données numériques sont scindées très clairement.

De plus suite au théorème de Nyquist, l'enregistrement des données PCM décimées sur un disque CD soumet ces signaux à une quantification sur 16 bits (65 536 états possibles) à une fréquence d'échantillonnage de 44,1 kHz. Les données de fréquence supérieure à cette fréquence d'échantillonnage sont éliminées, ce qui diminue le volume de données à chaque étape. Les fréquences qui dépassent la fréquence limite de reproduction (en principe la moitié de la fréquence d'échantillonnage, soit 22,05 kHz) sont éliminées. Enfin, la procédure de démarcation sur 16 bits limite la dynamique, en noyant les signaux sonores les plus faibles dans le bruit, de quantification.

A la reproduction (conversion N/A) les données PCM sont encore re-manipulées. Par exemple ; la plupart des lecteurs de CD / DVD utilisent un convertisseur numérique-analogique 1 bit pour retransformer les signaux numériques en signaux analogiques. Par ce traitement, les signaux PCM sont suréchantillonnés à fréquence élevée par un filtre numérique. Après un traitement d'interpolation qui permet de recréer les données, les signaux traversent un modulateur DS qui les reconvertit en un flux d'impulsion de données à 1 bit.
De ce fait, les données numériques au format PCM doivent subir un certain nombre de filtrage divers tels que : la décimation et l'interpolation.

Ainsi vous pouvez constater que dans le format PCM les données analogiques ont été manipulées et changées deux fois au minimum de l'original et les données numériques ont été divisées très clairement.


L'avantage du 1-bit

Dans l'enregistrement 1-bit, l'échantillonnage des sources sonores se fait à la fréquence très haute de 2,822 MHz et avec le MR-1000 jusqu'à 5.6448 mégahertz.
À cette cadence élevée, le système 1-bit est capable de reproduire une bande passante autorisant la reproduction de signaux dépassant les 100 kHz, ce qui excède tout autre systèmes numériques et même les bandes magnétiques qui peuvent reproduire jusqu'à 50kHz. A cette cadence élevée, nous n'avons plus besoin d'un filtre pour un suréchantillonnage du signal qui retire des élément et qui apporte automatiquement une coloration au signal.

Graph5
• Enregistre le signal original directement en 1bit
• La conversion N/A peut être aussi simple que le fonctionnement d'une impulsion à travers un filtre passe-bas analogique

Surprenant même, en restant au format 1-bit nous n'avons plus besoin de procéder à la filtration de décimation pendant l'enregistrement et à l'utilisation du filtre de suréchantillonnage pendant la lecture. Ainsi ce qui évite toute détérioration du signal. Rappelez-vous que dans le format PCM on utilise des filtres de décimation qui divisent le signal et de ce fait endommage celui-ci sur la reproduction, avec le système 1-bit on élimine tous ces filtrages.


Le plus du 1-bit

Le DSD permet d'enregistrer directement les données sur 1 bit sur le disque dur. La fréquence d'échantillonnage sur le MR-1 du format DSD est de 2,8224 MHz, 64 fois supérieure à la fréquence de 44,1 kHz utilisée pour les CD conventionnels et sur le MR-1000 du format DSD est de 5,6448 MHz, 128 fois supérieure à la fréquence de 44,1 kHz utilisée pour les CD conventionnels. Cette fréquence permet d'échantillonner le signal sonore 2,8224 (ou 5,6448) millions de fois par seconde, pour l'enregistrer sous forme de données à 1 bit sur le disque dur. Bien que ce nombre de bits ne représente qu' 1/16 de celui utilisé pour le format CD, la fréquence d'échantillonnage est 64 (128) fois supérieure, ce qui donne une capacité de données du DSD 4 (8) fois plus grande que celle d'un CD.


Modulation Delta Sigma (DS) et convertisseur A/N

Le quantificateur 1 bit décime les signaux analogiques d'entrée sur un niveau standard. Il fournit un signal de sortie sous forme d'une valeur parmi deux, "O" ou "1" (sur 1 bit). Prenons l'exemple de signaux sinusoïdaux entrant dans ce convertisseur 1 bit.

Graph6

Comme l'illustre la figure ci-dessus, la partie située au-dessus du niveau de base devient un niveau ''1'', alors que la partie située sous ce niveau de base devient "O". Le résultat est un signal de sortie carré. La différence entre la forme des signaux d'entrée et de sortie (zone grise en bas de la figure 3) est appelée bruit de quantification. Comme l'illustre cet exemple, même la méthode de conversion à 1 bit peut donner une distorsion importante du signal sonore de sortie.
En fait, dans la pratique, les impulsions seront plus fines afin de mieux suivre l'amplitude du signal et minimiser ainsi l'erreur de quantification traduite par les zones grises. C'est ce que réalise le modulateur Delta Sigma. Contrairement à la modulation PCM, qui ne gère que les données calculées, la modulation DS convertit les signaux analogiques directement en un flux d'impulsions de "O" et "1".

Graph7

De plus, l'augmentation de la fréquence d'échantillonnage diminue le bruit de quantification à basse fréquence, tout en augmentant ce bruit de quantification à haute fréquence. En fait, le bruit de quantification introduit par le modulateur DS est décalé vers les hautes fréquences. Le plancher du bruit de quantification de la modulation DS est incliné et non pas plat. Il est possible d'éliminer les effets du bruit dans les fréquences les plus élevées en faisant passer les signaux par un filtre analogique passe-bas à la reproduction.

La bande passante du 1-bit est une courbe régulière qui permet de reproduire précisément le signal analogique, autorisant la reproduction de signaux dépassant les 100 kHz.

Les figures ci-dessous illustrent la différence de sortie lors de la conversion d'un signal carré à 20 kHz avec le format 1-bit et les formats PCM, chaque image montre le signal d'entrée analogique et la sortie à la résolution de bit et à la cadence données de prélèvement :

Graph8Graph9
rectangle-blanc16Bit / 44,1Khzrectangle-blanc 24Bit / 96Khz


Graph10Graph12
rectangle-blanc24Bit / 192Khz rectangle-blanc1-Bit / 5,6MHz


* Nous pouvons voir qu'en 16 bit à 44,1 kHz, l'utilisation du signal carré de sortie devient une onde sinusoïdale, celui-ci ne permet pas de reproduire ces signaux au-delà de la seconde harmonique, donc les signaux carrés sont limités en fréquence à 20 kHz
* En 24 bits à 96 kHz, l'utilisation du signal carré de sortie est encore une onde sinusoïdale.
* En 24 bits à 192 kHz, on obtient une onde plus près de l'original, mais comme vous pouvez le voir, le signal carré de sortie est quand même déformé.
* Par contre, au format 1-bit à 5,6 mégahertz, vous remarquerez que le signal carré est pratiquement identique et le format 1-bit (DSD) permet de reproduire les harmoniques d'ordre très élevé, pour une onde de sortie très semblable à l'onde originelle. Cet exemple montre comment le format 1-bit permet d'obtenir une conversion sonore fidèle pour un résultat quasiment identique à la source.
Le traitement du signal 1-bit (DSD) permet d'obtenir une image sonore beaucoup plus détaillée, et donc la possibilité d'enregistrer les harmoniques de toute nature. Le système 1-bit utilisé dans la série MR permet de reproduire la qualité artistique d'un concert comme jamais auparavant, pour communiquer la vitalité de l'artiste comme l'ambiance de la salle.
Par contre, le format 1-bit (DSD) permet de reproduire les harmoniques d'ordre très élevé, pour une onde de sortie très semblable à l'onde originelle. Cet exemple montre comment le format 1-bit (DSD) permet d'obtenir une conversion sonore fidèle pour un résultat quasiment identique à la source.

Les avantages de l'enregistrement 1-Bit

Graph13

Comme le montre la figure ci-dessus, les données au format 1-bit sont transmises directement depuis le modulateur DS. Les données numériques au format PCM, par contre, doivent subir un certain nombre de filtrage divers tels que : la décimation et l'interpolation. Le format 1-bit (DSD) élimine ces traitements supplémentaires, ce qui évite par exemple le bruit de re-quantification comme l'ondulation résiduelle dans la bande passante. Il devient donc possible de transmettre des données qui conservent toute la pureté du son originel.

Tous les composants de la série MR ont été scrupuleusement sélectionnés pour un maximum de performance. Ainsi, le Cirrus Logic CS4398 est utilisé comme convertisseur Numérique/Analogique, et le Burr-Brown PCM4202 de Texas Instruments est utilisé comme convertisseur Analogique/Numérique.


Le 1-Bit comme format d'archive

La série MR supporte de nombreux formats dont le DSDIFF, DSF et WSD 1-bit, comme les formats multi-bit PCM (BWF) avec une résolution allant jusqu'à 24-bit à 192 kHz

Utile pour l'archive dont la conversion peut être n'importe quel format PCM

En conséquence, ce format d'enregistrement est idéal car il enregistre réellement ce que vous entendez, sans aucune déperdition. De plus, l'enregistrement 1-bit est un format d'archivage parfait, car celui-ci deviendra dans un futur proche un standard dans l'audio.
Avec le logiciel livré avec la série MR, celui-ci permet de convertir les enregistrements réalisés en 1-bit, dans vos sessions d'enregistrement et vos mix dans tous les formats audio actuels (voir visuel ci-dessous), sans aucune dégradation sonore.

Graph14
Capable d'être converti dans tous les formats actuels PCM