- Son multicanal
-
Le son multicanal englobe un éventail de techniques d'enregistrement, de mixage et de reproduction dit « surround » (« cerner », « encercler », « entourer », « environner »), c’est-à-dire, tout système de reproduction qui n'est ni monophonique ni stéréophonique.
Le « son multicanal » a commencé avec trois haut-parleurs, puis 4, 5, 6, 7, 8, … jusqu'aux 425 haut-parleurs de Iannis Xenakis. Le son multicanal implique au moins la tentative d'un champ sonore (un espace) horizontal de 360°. Certains autres systèmes tentent de gérer la verticalité mais restent au niveau de la recherche et de l'expérimental.
Historique
Article détaillé : Fantasound.Fantasound a été en 1940 le premier procédé stéréophonique à trois canaux, développé par l'ingénieur du son William E. Garity et le mixeur John N.A. Hawkins pour Walt Disney en 1938-1940 pour le film Fantasia, qui sera le premier film commercial utilisant le son multicanal. Il a conduit à l'élaboration de ce qui est aujourd'hui connu comme le 5.1.
Vers les années 1950, le compositeur allemand Karlheinz Stockhausen expérimente des compositions électroniques (Gesang der Jünglinge (en) et Kontakte (en)), celui-ci utilise des systèmes tournants et quadraphoniques avec l'aide de Herbert Eimert du studio Westdeutscher Rundfunk (WDR)[3].
En 1958 le Poème électronique pour bande magnétique d'Edgard Varèse, expérimente l'espace surround.
Iannis Xenakis explore également l'espace sonore avec 425 haut-parleurs utilisés pour déplacer le son dans l'espace. Il y a aussi de nombreux autres compositeurs d'avant-garde à la même époque qui ont créé des œuvres utilisant le son surround.
Prise de son multicanal
Il y a un distinguo sémantique à ne pas perdre de vue :
- Quand la prise de son est destinée à la reproduction d'un événement (par exemple musical), on l'appellera « captation » ; c’est-à-dire que l'« espace sonore » restera (relativement) le même à l'enregistrement et à la diffusion.
- Lorsque cette même prise de son aura pour mission d'accompagner l'image d'un film ou d'un événement sportif (par exemple), on ne pourra plus parler de captation mais de prise de son destinée à manipulations d'espaces variant découlant du montage image et des changements d'axes apportés par les changements d'axes et de cadre. Ce qui induit des problématiques complexes et psychoacoustiques.
Le 5.1 remet en question les techniques de prise de son. Principalement, l’espace, déployé autour de l’auditeur, est la notion tout à fait nouvelle dans l’écoute multicanal, c’est pourquoi on demande à un système de prise de son 5.1 d’en capter les subtilités. L’espace naît de la décorrélation interaurale, aussi un bon système doit présenter cette décorrélation avec une distance adéquate entre les microphones. Ensuite, l’autre difficulté du système est de présenter une bonne cohérence en localisation issue d’un recoupement adapté des différents secteurs spatiaux. On trouve aujourd’hui une multitude de systèmes, qui se développent parallèlement à l’évolution des formats multicanal (MMAD, decca tree, OCT Surround, INA5, Soundfield, sphère Schoeps KFM360, carré Hamasaki, croix IRT, holophone H2pro, dpa S5, dpa 5100…).
Mixage multicanal
Ces formats complexifient aussi le travail du mixage. Ils apportent des concepts à revisiter ou à innover autour des effets (outils de localisation, outils de spatialisation, gestion du LFE, traitement dynamique, downmixing, upmixing), des notions nouvelles autour du format (le bass management, la gestion de bus multiples) et des codages utilisés).
D'autre part, le mixage multicanal a ses subtilités de rapports psychoacoustiques entre le son et l’image dont on explore peu à peu les particularismes. Le mixeur doit trouver une cohérence entre le champ visuel déployé en frontal et le champ sonore qui s’installe tout autour de l’auditeur en gérant les principes de l’attention auditive. La réalisation artistique trouve de nouvelles possibilités d'expression dans cet espace qui peut être apprivoisé par la radio (fictions, documentaires), la télévision, la musique…
Formats de mixage et de diffusion multicanal
Musique
- La quadriphonie (ou quadraphonie) est inventée à la fin des années 1970, c'est le premier format multicanal[4] proposé au grand public. Plusieurs systèmes concurrents s'affrontent. Ces systèmes on été un échec commercial en raison de nombreux problèmes techniques, qui ont été résolus trop tard pour sauver la technologie de la catastrophe. Le format était plus cher que la stéréo standard Hi-Fi. Il nécessitait aussi deux haut-parleurs supplémentaires ainsi que leurs amplificateurs, et a souffert de l'absence d'un format standard pour les vinyles.
Article détaillé : Quadriphonie.- Musique en 5.1, curieusement, ce format n'a pas le succès escompté. On ne peut lire ce format que sur un DVD-Audio ou un SACD.
Cinéma et audiovisuel
Le LCRS
Le Dolby Stéréo est un format analogique. Quatre sources : gauche, centre, droite et arrière (surround) ou LCRS. En 1975, Dolby présente ce système analogique dérivé de la quadriphonie mais adapté à la reproduction sonore au cinéma en optique[5].
Matricé, dit 4.2.4
- 4 canaux au mixage: Left, Centre, Right, Surround (LCRS)
- 2 Matricés en deux pistes dites « Left total, Right total » (LtRt). Ces pistes recopiées (« report optique ») sur les deux pistes optiques analogiques de la copie dite « d'exploitation ».
- 4 canaux d'écoute au cinéma, les deux pistes matricées (LtRt) sont dématricées en 4 voies de diffusion LCRS au moment de la projection.
En plus du matriçage, le Dolby SR analogique utilise un autre procédé de réduction du bruit (« NR », pour « Noise Reduction ») d'« enregistrement/lecture » qui permet d'améliorer significativement la dynamique (rapport signal/bruit, entre les sons les plus forts et les sons les plus faibles).
Ce format multicanal analogique est toujours, en principe, utilisé au cinéma pour la diffusion des copies 35 mm (« chimiques ») en salle. À la fois pour les cinémas non (encore) équipés en numérique ainsi qu'en tant que format de secours en cas de panne du format numérique[6].
Dolby Surround Mixer Left Right Center Surround Left Total 1 0 Right Total 0 1 j = +90° phase-shift, k = -90° phase-shift
Mixage 5.1
Le format 5.1 a été le premier format multicanal numérique. Plusieurs systèmes de codage sont en concurrence, certains disparaîtront au fur et à mesure des évolutions et des circonstances. Tous les systèmes utilisent la même configuration.
Cinq enceintes entourent l'auditeur, accompagnées d’un subwoofer (le .1) qui diffuse les fréquences graves. Les cinq enceintes doivent être sur le même plan horizontal et identiques. Le subwoofer (.1), alimenté par le canal LFE, est disposé le plus couramment devant, proche de l'enceinte centrale, sa bande-passante est approximativement inférieure à 120 Hz. La disposition des enceintes est défini par l'UIT-R BS 775-1.
Le 5.1 et les autres
- le 5.1 normé aussi pour le DVD vidéo/home cinéma
- le 6.1 (5.1 plus une enceinte supplémentaire centrale à l'arrière pour le cinéma),
- le 7.1 de Sony SDDS cinq enceintes frontales et deux à l'arrière, (en voie d'abandon dans les années 2010),
- le 7.1 Dolby Surround trois enceintes frontales, deux latérales et deux à l'arrière et un caisson de basse (très peu d'enregistrement dans le commerce),
- le 7.2 Dolby Surround trois enceintes frontales, deux latérales et deux à l'arrière et 2 caissons de basse (materiel disponible au grand public depuis 2006 mais pas d'enregistrement dans le commerce),
- le 12.4 Mis en place en 1986 à la Géode par les ingénieurs de Cabasse,
Mixage 3D
Avec l'éclosion de l'image 3D, une plus grande et meilleure gestion de l'« espace sonore » devient possible. Une foultitude de formats sonores apparaissent, notamment des formats gérant la verticalité.
Les formats suivants, destinés au cinéma 3D numérique, prétendent ou tendent à gérer la verticalité de l'espace sonore :
- le 14.1 (développement en 2010) - face avant, L LC C RC R + en hauteur, Top L C R puis deux Top Surround L et R au plafond, Ls et Rs LR restant à leur place,
- (22.2 (en)), format développé par la NHK pour accompagner le Super High Vision, format supérieur à la HD 1920x1080 pixels, Super Hi Vision = 7680x4320 pixels, etc.
Les techniques de codage qui accompagnent le 5.1 sont, pour le cinéma photochimique, le Dolby Digital et le DTS pour le DVD vidéo, le Dolby E et le Dolby Digital pour la TVHD (le Dolby E pour la production, Dolby Digital ou le He-AAC pour la diffusion vers les particuliers, ces formats permettant l'utilisation de metadonnées utiles pour le bon enchaînement des programmes sur une chaîne HD, une bonne gestion de la dynamique, des possibilités de downmix pour les compatibilités stéréo et mono). Le SACD et le DVD audio sont des supports prévus pour la musique en 5.1, mais on trouve de plus en plus fréquemment le DVD hybride (CD et DVD vidéo DTS ou Dolby Digital) moins coûteux à produire. Les supports HD DVD et Blu ray sont compatibles 5.1, mais sont prévus pour intégrer un son 7.1, accompagné des techniques Dolby Digital évoluées (Digital +, Digital true HD), DTS HD, DTS Master HD, PCM, DSD. On trouve des formats 5.1 compressés pour Internet notamment le mp3surround et le mpegsurround. Ils servent aujourd'hui notamment à la diffusion des radios HD 5.1.
Le cinéma numérique
Article détaillé : D-cinéma.Une résolution accrue.
Formats de supports et de transport
Article détaillé : Format de fichiers audio.Dolby E
Le Dolby E n'est, ni un format de mixage, ni un format de diffusion[8], c'est un format d'encodage et transport du signal dit de contribution.
Article détaillé : Dolby E.Les Metadonnées
Article détaillé : Métadonnée (audio).Pour l'audiovisuel, les métadonnées spécifiques sont toujours en voie avancée d'évolution et de normalisation[9].
- L'Advanced Media Workflow Association, Inc. (AMWA)[10] continue depuis 2000 de développer les compatiblilités entre AAF (Meta Advened Audio Framework), MXF et le XML pour l'univers de l'audiovisuel et des plateformes internet (y compris le Flash d'Adobe Systems).
Télévision et DVD
Le sport est notamment le facteur décisif qui a porté la télévision en haute définition avec un son 5.1. Nombreuses sont les applications du son multicanal : la télévision haute définition, le cinéma, le film sur DVD vidéo et sur les nouveaux supports HDDVD et Blu ray, le jeu vidéo (DVD, HDDVD, Blu ray), la musique et les concerts (SACD, DVD audio, DVD vidéo), la radio HD, le DAB, Internet…
Les jeux
Historiquement, au début du multimédia, les jeux sont longtemps restés en mono, pour les systèmes d'exploitation (OS), la piste sonore est secondaire, les premiers logiciels multimédias d'animation sont axés sur l'image, la synchronisation entre l'image et le son est encore problématique.
L'apparition du format multicanal a aussi été très tardive (comparativement au cinéma), aux alentours de la fin des années 2000 toujours pour les mêmes raisons.
L'IMAX
Article détaillé : IMAX (pour l'image seulement).Le système sonore de l'IMAX possède au moins 6 canaux discrets dont un disposé au plafond. Il gère donc l'espace sonore vertical.
Un autre système de contrôle du niveau de diffusion de chaque piste sonore permet d'optimiser et d'adapter la reproduction aux particularités acoustiques de chaque salle du circuit.
Le SHOWMAX
Article détaillé : SHOWMAX.Le système sonore du SHOWMAX possède jusqu'à 8 canaux discrets. Il gère l'espace sonore 3 D.
Téléphones portables
Problématique de la diffusion multicanal
Le système d'écoute 5.1 est assez complexe à régler. On préconise tout d'abord un niveau de travail de 85 dBC SPL au cinéma et aux alentours de 79 dB SPL pour la TVHD. Chaque enceinte doit restituer le même niveau. Il est aussi nécessaire d’accorder les cinq enceintes en fréquence ainsi qu’harmoniser avec le local d'écoute qui crée des premières réflexions. Le bass management qui consiste à redéployer les basses fréquences des enceintes principales dans le subwoofer, nécessite un réglage, on peut le trouver à différents points de la chaîne (processeur de monitoring 5.1, console numérique, logiciel audio…).
Ce qui différencie principalement la reproduction multicanal au cinéma, à la télévision et pour le DVD c'est d'abord le niveau d'écoute :
- La salle de cinéma est un endroit dédié qui pourrait s'apparenter à un auditorium, le lieu est isolé et traité acoustiquement, le niveau sonore peut être élevé.
- Pour le DVD et la télévision, l'environnement est urbain, les voisins empêchent d'avoir des niveaux d'écoute comparables à la salle de cinéma (le niveau de référence est de 85 dB SPL au cinéma, en appartement il sera aux alentours de 79 dB SPL).
Image sonore multicanal
Le 5.1 permet l'immersion de l'auditeur, celui-ci ne regarde plus l'évènement à travers une fenêtre comme il en a pris l'habitude avec la stéréo, qui n'est pas un « format » naturel. En multicanal, l'auditeur « vit » l'évènement, entouré par le champ sonore grâce notamment aux enceintes arrières, presque comme s'il était dans la salle de concert ou en situation réelle.
Pour revivre réellement les conditions du concert ou de l'évènement sportif, il faudrait néanmoins apporter davantage de directions sonores que celles proposées par le 5.1. C'est pourquoi on trouve des formats supérieurs comme le 7.1, ou des formats qui apporte la notion de hauteur en ouvrant d'avantage l'image sonore : 10.2, le 22.2, ou bien la WFS (Wave Field Synthesis) qui reproduit, à l'aide d'une couronne d'enceintes, le champ sonore par le principe physique d'Huygens.
Le 5.1 est aussi un outil de dynamique avec les différents degrés de localisation qu'il présente. Tout d'abord, l'auditeur trouve une localisation possible tout autour de lui et un vrai centre (différent du centre fantôme) qui propose une solution intéressante pour le récit, utilisé depuis longtemps au cinéma. D'autre part, les mouvements de sources sonores sont possibles, les points de vue aussi plus libres comme la zone d'écoute plus large. En effet, l'auditeur, s'il n'est pas devant une image, peut se tourner pour découvrir d'autres points de « vue » et se déplacer dans sa zone d'écoute. L'impression d'espace est nettement plus forte qu'en stéréo car l'auditeur est enveloppé. Il ressent plus d'espace, la salle acoustique ou le lieu est mieux représenté sans repliement de zones comme en stéréo où tout est entassé. Enfin, comme c'est un format plus naturel, l'intelligibilité est nettement meilleure. Le cerveau ne travaille plus autant qu'en stéréo pour reproduire une image du lieu car celle-ci se dessine naturellement dans notre représentation mentale qu'est l'image sonore.
Lexique
Définition de certains termes techniques, en quelques lignes :
- 2+2+2+2 : format multicanal appelé aussi aurophonic system 8 présentant la notion de hauteur
- 6.1 : format multicanal utilisé pour la salle de cinéma intégrant un canal central arrière
- 7.1 : format multicanal comportant deux enceintes supplémentaires, il existe plusieurs configurations d’écoute, format utilisé par le codage Sony SDDS et les supports HDDVD (obsolète) et Blu ray
- 10.2 : format multicanal développé par Tomlinson Holman qui apporte l'information de hauteur
- 22.2 : format multicanal développé par la NHK pour accompagner le super high vision (7680x4320 pixels)
- Bass management : Redéploiement des basses fréquences des cinq enceintes principales vers le subwoofer permettant ainsi un meilleur respect du spectre pour les petites écoutes 5.1
- Blu ray : support haute définition pour le film, format multicanal 7.1 compatible 5.1, intègre les formats Dolby Digital, Dolby Digital +, Dolby Digital true HD, DTS, DTS HD, DTS HD Master, PCM
- Carré Hamasaki : système de captation d’ambiance 4.0 développé par la NHK, constitué de quatre capsules bidirectionnelles placées en carré
- Croix IRT : système de captation d’ambiance 4.0 développé par l’IRT, constitué de quatre capsules cardioïdes placées en croix
- DAB : Digital Audio Broadcasting, système de radiodiffusion numérique standardisé développé par le projet européen Eureka 147
- Decca tree : système de prise de son multicanal constitué de cinq microphones omnidirectionnels
- Dolby SR : format de matriçage Dolby 4-2-4 Lt Rt utilisé pour diffuser un son 5.1 sur deux canaux, signal de secours utilisé pour la diffusion dans les salles de cinéma ainsi que pour la diffusion en TVHD
- Dolby Digital : format de codage numérique 5.1 avec compression de données audio (AC3), utilisé pour le DVD vidéo, le cinéma, la TVHD
- Dolby Digital plus : format évolué du Dolby Digital qui permet de restituer un son sur 7.1 canaux et plus, à un débit de 6 Mbps. Ce format est compatible avec le Dolby Digital
- Dolby Digital true HD: l’encodage du Dolby True HD utilise une technologie cent pour cent sans perte avec un débit d’informations jusqu’à 18 Mbps. Ce format de son dernière génération supporte jusqu’à huit canaux pleine bande 96 kHz/24 bits
- Dolby E : système de codage professionnel utilisé en production pour la TVHD. Format de matriçage 8-2-8 qui permet la distribution de son 5.1 accompagné d’un signal Lt Rt ou stéréo en utilisant seulement deux canaux audio des infrastructures de post-production et de broadcast. Ce format intègre des metadata de contrôle du signal
- Downmix : procédé de mixage des canaux multicanal vers un format stéréo ou mono, intègre des coefficients variables (metadonnées) pour la sommation des canaux du centre et de l’arrière.
Par exemple :
- L stéréo= L + C(-3dB) + LS(-3dB)
- R stéréo= R + C(-3dB) + RS(-3dB) - DTS : Digital Theater System, format de codage 5.1 utilisé pour le DVD vidéo, le cinéma, format concurrent de Dolby
- DTS HD : codage DTS 7.1 haute définition compatible 96 kHz / 24 bits, débit de 6 Mbps
- DTS Master HD : codage DTS 7.1 haute définition compatible 192 kHz / 24 bits identique bit pour bit au master audio, débit variable allant jusqu'à 24,5 Mbps
- DVD audio : support audio pour la musique en 5.1 intégrant un son PCM haute définition jusqu’à 96 kHz / 24 bits en multicanal et 192 kHz / 24 bits pour la stéréo. Le DVD audio comporte aussi un format Dolby Digital et utilise la technologie de réduction de donnée sans perte MLP Lossless
- HDDVD : support haute définition pour le film, format multicanal 7.1 compatible 5.1, intègre les formats Dolby Digital, Dolby Digital +, Dolby Digital true HD, DTS, DTS HD, DTS HD Master, PCM
- He-AAC : (High Efficiency AAC) codage audio 5.1 pour la diffusion en TVHD, l’alternative de codage en comparaison avec le Dolby Digital +
- INA5 : système de prise de son multicanal constitué de cinq microphones cardioïdes, basé sur la théorie des angles de prise de son, développé par U. Herrmann et V. Henkels
- LFE : low frequency effect, bus de mixage portant les effets basses fréquences ou l’extension vers le grave d’un mixage, alimente le subwoofer
- Metadata : ensemble de metadonnées (dialog level, dynamic range control, downmix) intégrées aux flux Dolby E et Dolby Digital permettant le bon contrôle de la diffusion du signal (contrôle du niveau de diffusion en fonction du programme, sa dynamique, la compatibilité descendante stéréo et mono)
- MMA : Multichannel microphone array, système de prise de son multicanal développé par M. Williams et G. Le Dû. Il est constitué généralement de cinq capsules cardioïdes et repose sur la théorie des angles de prise de son
- Mp3surround : codage utilisé pour la diffusion 5.1 sur internet
- Mpegsurround : codage utilisé pour la diffusion 5.1 des radio HD ou le DAB
- OCT Surround : système de prise de son multicanal développé par G. Theile. Il est constitué de trois microphones cardioïdes et de deux hypercardioïdes. Ce système repose sur le principe de réduction de la diaphonie acoustique existant entre les images fantômes multiples
- Radio HD : radio numérique haute définition, diffusion 5.1 possible, certaines webradios diffusent un son 5.1 grâce à la technologie MP3surround
- SACD : support haute définition pour la musique, intègre un format audionumérique DSD (Direct Stream Digital) disponible en 5.1 et en stéréo. Compatibilité du support avec les lecteurs CD pour la stéréo
- Soundfield : système de prise de son multicanal à matriçage reposant sur le principe mathématique de décomposition du champ acoustique en quatre composantes, trois composantes bidirectionnelles suivant un repère cartésien et une composante omnidirectionnelle
- Sphère Schoeps : système de prise de son multicanal à matriçage, constitué d’une sphère stéréo et de deux microphones bidirectionnels accolés aux capteurs de pression et dirigé vers l’avant.
- TVHD : télévision haute définition, intègre une image HD 1920x1080 pixels et un son multicanal 5.1 codé principalement en Dolby Digital. On trouve d’autres formats d’image HD
- Upmix : procédé de traitement d’un signal stéréo ou mono vers un format supérieur 5.1
- WFS : Wave Field Synthesis, technique de reconstitution du champ acoustique fondée sur l’utilisation de bancs de haut-parleurs. Ce procédé repose sur le principe d’Huygens qui stipule que le front d’onde rayonné par une source se comporte comme une distribution de sources secondaires
Notes et références
- LFE est en fait mélangé sur un ou plusieurs des 5 pistes pour être extrait à la reproduction. On peut dire que ces systèmes sont encodés mais ce terme est trop vague car il désigne plusieurs processus, d'ailleurs pouvant être utilisés conjointement. Le son multicanal se définie par le nombre de pistes et le nombre de canaux ou voies de reproduction (HP ou famille de HP). 5.0 signifie 5 pistes et 5 canaux. 5.1 signifie 5 pistes et 6 canaux de reproduction, le « .1 » (ou le .2) précise que ce canal
- Le « sweet spot » est la zone d'écoute entre les haut-parleurs où l' auditeur entendra le mixage audio de la même façon que le mixeur.
- Stockhausen et le studio de musique électronique de la WDR à Cologne - SoNHoRS
- appelé ultérieurement 4.0 (stéréo frontale + stéréo arrière - dérivé du format 70 mm)
- (en) Dolby : The Formula for Film Sound Success - Site officiel de Dolby
- Sur une copie de projection photochimique, il faut tenir compte de l'usure de la pellicule. Bien que très résistant au corrections d'erreur, le format Dolby Digital bascule automatiquement sur le SRD au delà d'un certain taux d'erreurs mesurées de lecture, il retourne automatiquement en numérique quand il détecte que cela est possible.
- (en) en:Low-frequency effect
- Le Dolby E peut s'apparenter à un format de diffusion, bien qu'il n'est soit qu'une partie intermédiaire.
- Dolby-volume
- (en) Site de l'Advanced Media Workflow Association (AMWA)
Annexes
Articles connexes
- Son stéréophonique
- DVD
- Super Audio CD
- Dolby
- DTS
- 5.1
- 7.1
- 22.2 surround sound
- Auro 3D
- LFE
- HD DVD
- Blu ray
Liens externes
Wikimedia Foundation. 2010.