- Format audio
-
Format audio
Un format audio est un format de données utilisé en informatique pour représenter des sons, de la musique ou des voix sous forme numérique. De nombreux standards existent; certains s'appliquent mieux que d'autres au stockage de types particuliers de signaux audio.
Caractéristiques des formats audio
Chaque format audio présente des caractéristiques découlant de l'algorithme de compression/décompression, ou codec, qu'il utilise. Après la numérisation du son, le format utilisé est inscrit dans l'extension du fichier de données qui en stocke la transcription.
Dans un format donné, les fichiers sont déclinés en plusieurs taux de compression ou format de données (p. ex. codées sur 8, 16 ou 24 bits) avec différentes fréquences d'échantillonnage (p. ex. 22.05, 44.1 ou 48 kilohertz), qui induisent des niveaux de qualité sonore et des taille de fichier très différents. De manière générale, pour un codec donné, plus le taux de compression est bas, plus le fichier est volumineux, mais plus la qualité sonore du fichier comprimé s'approche de la celle du fichier non comprimé. Par contre, plus le taux de compression est haut, plus le rendu sonore perd de sa qualité (ceci est valable uniquement pour les codecs avec pertes).
Formats de numérisation du son
CDA (Compact Disc Audio)
Le CDA est le format des pistes des CD audio, telles qu'elles apparaissent lorsqu'elles sont insérées dans le lecteur CD-ROM. Les CD audio du commerce répondent à la norme professionnelle "Red Book". La technique d'échantillonnage du son utilisée pour les disques compacts est la modulation d'impulsion codée (en anglais PCM, pour Pulse Coded Modulation).
Pour le calcul de la taille d'une piste: 44.1kHz*2B*2*t
où t est la durée en secondes de la piste. 44.1kHz est la fréquence d'échantillonage, 2B (2 bytes ou 2 octets) équivalent à 16 bits sont la taille d'un échantillon, et le fait qu'un CD soit stéréo (deux pistes audio) introduit le facteur 2.
Exemple : un morceau d'une durée de 00:04:22 = 262s ; la taille des données est 44100Hz*2B*2*262=46216800B=46.2MB (=44.08 MiB).
Le suffixe des fichiers créés est .cda
Pour Non comprimé, forcément qualité CD Contre Volumineux, Pas de gestion de Tag (certains CD sont CD text) RAW
RAW est un format audio utilisé pour représenter les données de son en modulation d'impulsion codée sans en-tête ni métadonnées.
WAV (Waveform Audio Vector)
Le format WAV mono ou stéréo, mis au point par Microsoft et IBM, est l'un des plus répandus. Le format "Disque compact" 44.1 kHz, 16 bits et stéréo nous servira de référence pour le calcul du poids et ratio des autres formats.
Pour le calcul du poids : 44100*2(2octets=16bits)*2(stéréo)*60(secondes)+ en-têtes = 11 300 kilooctets/minute
Le suffixe des fichiers créés est .wav
Pour Non comprimé (pour la version PCM) Contre Pas de gestion de Tag (certains CD sont CD text), limité à 2 Go Ogg Vorbis
Le format Ogg Vorbis est un format libre, fruit de la fondation Xiph.org. Vorbis se différencie des MP3, WMA et autre AAC par son algorithme. Il segmente les sources audio en paquets successifs, l'algorithme de compression agissant dans un premier temps sur chaque paquet indépendamment des autres. Cela lui permet d'avoir très peu de faiblesses sur certaines fréquences et de conserver la même qualité quel que soit le type de musique.
Le suffixe des fichiers créés est .ogg ou parfois .oga.
Par abus de langage, on appelle 'fichier Ogg' des fichiers musicaux compressés par l'algorithme Vorbis. Ceci peut être particulièrement dérangeant à l'ère des baladeurs numériques supportant audio et vidéo. En fait, Ogg est un conteneur qui peut contenir des pistes sonores (Vorbis), audio sans perte (FLAC), audio parlées (Speex) et vidéo (Theora). Un 'fichier Ogg' peut donc contenir l'un ou l'autre (ou une combinaison) de pistes. Pour être plus clair, nous devrions parler de fichier Ogg Vorbis lorsque nous mentionnons un fichier .ogg qui ne contient qu'une piste sonore au format Vorbis.
Pour Comprimé, meilleure qualité que le MP3, open source, très bon pour le streaming, supporte 255 canaux Contre long à l'encodage iKlax
Le format Iklax est un format numérique d'écoute active développé par la société iKlax Media et le LaBRI. Ce format de fichier de type conteneur permet d'organiser la musique en différents groupes et de leur appliquer des contraintes. Le format Iklax est le premier format audio multipiste interactif (lancé début 2008).
Le format a bénéficié d'une parution scientifique lors de l'ICMC 2008 (Internation Computer Music Conference) à Belfast.
FLAC (Free Lossless Audio Codec)
Le format flac est un format libre de compression audio sans perte. Maintenu par la fondation Xiph.org, il est apprécié pour conserver la qualité des fichiers sonores originaux en alternative aux formats de compression avec perte type mp3.
Pour Pas de perte de qualité, open source. Contre Plutôt volumineux AIFF (Audio Interchange Format File)
L'AIFF est un format de stockage de sons sur les ordinateurs de Apple. C'est l'équivalent du format WAV dans le monde Macintosh.
Les résolutions 8, 16, 20, 24 et 32 bits (à virgule flottante) sont acceptées.
Le suffixe des fichiers créés est .aif
Pour Non comprimé, Contre Très volumineux, une variante l'AIFF-C permet de comprimer la taille jusqu'à 6x. AAC (Advanced Audio Coding) ou MPEG-2 AAC
L'AAC est une extension du MPEG-2 et a été amélioré en MPEG-4, MPEG-4 Version 2 et MPEG-4 Version 3. Il a été reconnu fin avril 1997.
Il fait partie des successeurs du MP3.
Le suffixe des fichiers créés est .aac, .mp4, .m4a
Pour Très bon codec destructif (mieux que MP3 et WMA), pas de trous (Gapless), mode 5.1 ou plus. Contre Durée d'encodage importante Apple et l'AAC : Apple l'a choisi comme codec privilégié, on le retrouve dans son iPod et son logiciel iTunes. Pour la vente musicale en ligne iTunes Music Store, la norme AAC ne proposant pas de système de gestion des droits numériques (DRMs), Apple a développé son propre système, appelé FairPlay. Il est lisible sur Mac OS et Windows, uniquement avec le logiciel iTunes.
MP3 (MPEG-1 Layer III)
Star incontestée des formats audio, MP3 est l'abréviation de MPEG Audio Layer 3. Cet algorithme de compression prend naissance en 1987. L'ISO en fera un standard dans les années 92-93. La couche (Layer) III est la couche la plus complexe. Elle est dédiée à des applications nécessitant des débits faibles d'où une adhésion très rapide du monde Internet à ce format de compression. Les taux de compression (ratio) sont d'ordinaire de 1 pour 10 (1:10) (1:4 à 1:12). Très rapide à l'encodage. Des royalties importantes sont à payer pour exploiter la licence MP3. Utiliser l'encodeur MP3 LAME dernière version, encodé à 130 Kib/s (V5) permet d'obtenir une qualité comparable au AAC (Advanced Audio Coding) encodé à 48 kbit/s. [1]
Le suffixe des fichiers créés est .mp3
Type de compression : constant ou variable (VBR)
Pour Grande compatibilité, gestion des tag ID3. Contre Compression destructive avec problèmes dans les aigus, lors d'un ré-encodage on passe par un fichier .wav . mp3PRO
Le format mp3PRO, fruit de la collaboration entre Thomson Multimédia et l'Institut Fraunhofer, combine l'algorithme MP3 et un système améliorant la qualité des fichiers comprimés appelé SBR pour Spectral Bandwidth Replication.
Ce format a été publié à la fin de 2001 ; un fichier MP3pro 64 Kbit/s a un poids deux fois plus petit qu'un fichier MP3 à 128 Kbit/s, mais pour une qualité similaire, voire meilleure !
Le suffixe des fichiers créés est .mp3
Pour Gain de place. Contre Doit obligatoirement être relu avec un lecteur mp3pro. Un fichier 64 Kbit/s relu avec un mp3 classique équivaut à un fichier mp3 de 60 Kbit/s (coupure à 11 kHz). Moins bon que le mp3 (coupure avant 16kHz). - 64 Kbit/s, qualité moyenne due à l’écrasement des pics, moins bon que l'ACC+, le seul encodeur gratuit supportant le MP3 Pro ne code qu'en 64 Kbit/s, lors d'un réencodage on passe par un fichier .wav . Altération définitive des fichiers codés. VQF ou TwinVQ (Transform-domain Weighted Interleave Vector Quantization)
Le format TwinVQ a été développé par NTT Cyber Space Laboratories et soutenu par Yamaha. Dans le même esprit que le MP3, il comprime encore plus et avec une meilleure qualité. On regrettera une durée d'encodage un peu trop longue, près de 10 fois plus lente que le MP3. De plus, arrivé bien plus tard, et distribué sous une licence très restrictive, il a eu peu d'adeptes et est plus ou moins abandonné.
Le suffixe des fichiers créés est .vqf, .vql ou .vqe
WMA (Windows Media Audio)
Le format WMA, créé par Microsoft à partir des recommandations MPEG-4 en 1999, est utilisé par le logiciel Windows Media Player. Ce format est lié à une gestion pointue des droits d'auteurs (Gestion numérique des droits, en anglais Digital Right Management ou DRM) qui permet de définir par exemple une durée de vie limitée pour les fichiers ou d'interdire les possibilités de gravure.
Il existe plusieurs versions du codec (wma7.1, wma9, wma pro).
Le suffixe des fichiers créés est .wma
Pour Bonne compatibilité, gestion des tag, meilleure compression que le MP3. Contre Souvent illisible sur lecteurs portables, à cause de la gestion des droits et des restrictions dans le format wma. AU
Le format AU est assez bien répandu grâce à Unix et Linux. La fréquence d'échantillonnage est comprise entre 1 kHz et 200 kHz. Mais les applications de rendu audio ne lisent principalement que trois fréquences d'échantillonnage : 8012.821 (codec entré), 22050 et 44100 hertz.
Le suffixe des fichiers créés est .au
Pour Contre Les résolutions 8, 16, 20, 24 et 32 bits (flottant) sont acceptées.
ASF Advanced Streaming Format
ASF est un format conteneur de Microsoft servant au streaming audio et vidéo.
Pour Contre Conteneur propriétaire très fermé (Microsoft) AA Audible
AA est un format utilisé par Apple.
Pour Contre ) Choix de la norme pour l'archivage d'un enregistrement
Choix de la norme pour la diffusion d'un enregistrement
Norme appliquée à un support
Norme appliquée au streaming
Au-delà de la qualité CD
Aujourd'hui, la norme CD a prouvé ses limites, tant au niveau de sa fréquence d'échantillonnage que dans sa définition de 16 bits. Aidé par les nouveaux supports informatiques, le son peut être numérisé en 24 bits, voire 32 bits. La fréquence quant à elle est passée à 88.2, 96, 176.4, ou 192 kHz. Cette avancée permet d'avoir un son plus dynamique et plus détaillé dans les transitoires donc d'être plus proche de l'oreille humaine.
Le DVD-Audio est un exemple de qualité supérieure, mais ce type de média ne semble pas attirer le grand public. Sony a également tenté d'imposer son SACD (SuperAudio CD), qui a l'avantage d'exister en version hybride : il est lisible à la fois selon la norme CD Audio classique, sur tous les lecteurs, et en SACD sur un lecteur dédié. Une fois de plus, ce format ne semble pas attirer l'attention du grand public. Le problème ne vient donc pas des solutions, mais du grand public trop conquis par les formats compressés et ne laissant pas de chance aux nouvelles solutions.
Avant la numérisation
Un filtre passe-bas analogique "anti-alias" (c.a.d. anti-repliement de spectre) est appliqué au signal analogique. Son rôle est de supprimer toutes les fréquences supérieures à la moitié de la fréquence d'échantillonnage. Sans ce filtre, toute fréquence (indésirable) de valeur Fs/2 + a est restituée à la fréquence Fs/2 - a ce qui donne un spectre erroné. C'est comme un phénomène stroboscopique, tel que les roues de voitures vues au cinéma : une fois elles tournent dans le "bon sens", puis dans le "mauvais sens". Exemple : avec le format CD audio, Fs = 44.1kHz et Fs/2, la fréquence maximale reproductible, vaut 22.05 kHz. Exemple de filtre typique choisi pour cette fonction en raison de son excellente réponse en fréquence : le filtre de Butterworth à -18 dB/octave.
Choix et origine de l'étrange fréquence 44.1kHz
http://fr.wikipedia.org/wiki/Cd#L.27.C3.A9chantillonnage
Les supports
- Disque compact
- Digital Audio Tape
- Minidisc
- Digital Compact Cassette
- Super Audio CD
- Disque numérique polyvalent (DVD)
- HD DVD
- Blu-ray Disc
- Carte CF
- Disque dur
Références
- ↑ (en)Gabriel Bouvigne for MP3'Tech - www.mp3-tech.org, « 48 kbit/s AAC public test », June 2007
Voir aussi
Liens internes
- MOS : abréviation de Mean Opinion Score, ou Note d'opinion moyenne. Il s'agit d'une note donnée à un codec audio pour caractériser la qualité de la restitution sonore. La note peut varier entre 0 (très mauvais) et 5 (excellent, comparable à la version d'origine)
- A2DP : Advanced Audio Distribution Profile est un profil Bluetooth.
- SBC : Low Complexity Subband Codec est un codec de compression audio et vidéo spécialement conçu pour les applications audio et vidéo de Bluetooth
- Encodage : ou codage, il consiste à transformer une source vidéo ou audio en un format informatique déterminé, à l'aide de codecs. Le terme de codage est un terme plus général, mais l'usage veut que encodage désigne plus particulièrement les données multimédias.
- Compression audio : a pour but de réduire la taille d'un fichier audio.
- G.723 : il faisait autrefois référence à une norme de codec audio de type ADPCM… G.723.1 désigne une autre norme de codec audio de type vocodeur.
- G.726 : encore un codec pour le téléphone
- G.729 : utilisé pour le codage de la partie audio d'une visioconférence
- VBR : Variable bit rate, terme anglais que l'on peut traduire en français par : « taux d'échantillonnage variable »
- CBR : Constant bit rate, terme anglais que l'on peut traduire en français par : « taux d'échantillonnage fixe »
- ALAC : Apple Lossless Audio Codec est un format d'encodage sans perte (lossless)
- Voix sur réseau IP : parfois appelée téléphonie IP ou téléphonie sur Internet, souvent abrégée en « VoIP » (abrégé de l'anglais Voice over IP)
- Traitement de la parole : notion sur le son et son traitement dans la communication par le téléphone
Liens externes
- dbpoweramp.com, site pour charger les derniers codecs
Catégories : Enregistrement sonore | DJing
Wikimedia Foundation. 2010.