ISO 15444

JPEG 2000

Comparaison du JPEG 2000 avec d'autres formats

JPEG 2000 ou ISO/CEI 15444-1 est une norme commune à l’ISO, la CEI et l’UIT-T. C’est une norme de compression d’images produite par le groupe de travail Joint Photographic Experts Group. JPEG 2000 est capable de travailler avec ou sans perte, utilisant une transformation en ondelettes (méthode d’analyse mathématique du signal). En compression irréversible, JPEG 2000 est plus performante que la méthode de compression JPEG ISO/CEI 10918-1 (JPEG baseline). On obtient donc des fichiers d’un poids inférieur pour une qualité d’image égale. De plus, les contours nets et contrastés sont mieux rendus.

La norme comprend 12 parties sous la même dénomination JPEG 2000, c'est cependant à la première partie que l’on fait référence comme « cœur » du système. JPEG normalise uniquement l'algorithme et le format de décodage. La méthode d'encodage est laissée libre à la concurrence des industriels ou universitaires, du moment que l'image produite est décodable par un décodeur standard. La norme propose un jeu de fichiers de tests appelés fichiers de "conformance", qui permettent de vérifier qu'un décodeur soit conforme à la spécification de la norme. Un décodeur est dit conforme, s'il est capable de décoder tous les fichiers de référence de "conformance". C'est l'objet de la partie 4 du document.

Partie 1 : cœur du système de codage
Partie 2 : extensions
Partie 3 : Motion JPEG 2000
Partie 4 : conformance
Partie 5 : logiciel de référence
Partie 6 : compound image file format
Partie 7 : a été abandonnée
Partie 8 : JPSEC sécurité
Partie 9 : JPIP protocole interactif
Partie 10 : JP3D imagerie volumétrique
Partie 11 : JPWL wireless
Partie 12 : ISO Base Media File Format (commun avec MPEG-4)

Les performances en compression de JPEG 2000, bien que meilleures que JPEG à bas débit ne sont pas révolutionnaires. Ce sont plutôt la multitude de nouvelles caractéristiques telles la scalabilité, les régions d’intérêt, la résistance aux erreurs de transmission, le codage sans pertes, la versatilité de l’organisation des données, ainsi que les diverses extensions visant une application (interactivité, sécurité, sans fil, etc.) qui font l’intérêt de cette norme.

Par ses fonctionnalités avancées, sa capacité à gérer les images de grande taille, ainsi que d’excellentes performances à haut débit, JPEG 2000 s'adresse aux professionnels de l’image, mais n'a pour l'instant que peu d'applications grand public. En particulier, sa présence sur le World Wide Web est marginale^{[réf. nécessaire]}.

Sommaire

1 Principe général
2 Prétraitement
- 2.1 DC level shift
- 2.2 Transformée couleur
3 Transformée en ondelette
- 3.1 Découpage en tuiles
4 Quantification
5 Codage entropique
6 Allocation de débit
7 Mise en forme et syntaxe
8 Régions d'intérêt
9 Résistance aux erreurs
10 Bibliographie
11 Voir aussi
12 Notes et références
13 Liens externes

Principe général

Principales étapes de l'encodage JPEG-2000

Le processus de codage suit un schéma classique de modification des propriétés statistiques des données source par un changement d’espace par une transformée, avant quantification des coefficients issus de cette transformée puis codage entropique. Les nouveautés par rapport à JPEG du point de vue compression sont l’utilisation d’une transformée en ondelettes, qui offre une scalabilité naturelle, mais surtout d’un algorithme de codage entropique très sophistiqué. Celui-ci est fortement basé sur l’algorithme EBCOT de David Taubman. Il consiste en un regroupement et une modélisation des coefficients ondelettes qui fournissent à un codeur arithmétique adaptatif un train binaire possédant les propriétés statistiques adéquates.

Il s'ensuit une étape d'allocation de débit qui permet de respecter le débit cible, et dont le travail est facilité par le partitionnement du train binaire formé par EBCOT. La dernière étape est la mise en forme syntaxique du codestream JPEG 2000, avec la formation des paquets, puis la syntaxe haut niveau, particulièrement abondante dans JPEG 2000.

Dans la norme JPEG 2000 un codestream est l'ensemble des données formées par les données images compressées regroupées dans des paquets ainsi que la syntaxe de haut niveau: en-têtes de tuiles, en-tête principal. Les métadonnées du format de fichier JP2 ne font pas partie du codestream. JP2 encapsule le codestream JPEG 2000 dans un format de fichier.

Prétraitement

DC level shift

La première étape, très simple, consiste à transformer les valeurs des pixels en valeurs signées. Typiquement, on passe d’une représentation de [0 255] à [-128 127], afin d’avoir un signal centré autour de zéro.

Transformée couleur

artefacts liés à la compression JPEG 2000. Le ratio de compression est indiqué en face de chaque image

La transformée couleur est optionnelle. Elle consiste à passer de l’espace couleur de l’image d’origine (RVB en général) à l’espace couleur YUV (1 luminance, 2 chrominances) plus adapté pour la compression car les 3 composantes sont beaucoup moins corrélées.

Deux transformées sont spécifiées : une irréversible (ICT pour Irreversible Component Transform), à coefficients réels, et une réversible (RCT pour Reversible Component Transform) à coefficients entiers. L’intérêt de la RCT est d’être utilisée en combinaison avec la transformée en ondelette réversible 5/3 pour la compression sans pertes.

Bien que la RCT puisse être utilisée pour du codage avec pertes, c’est généralement l’ICT qui est utilisée car elle donne de meilleurs résultats.

Transformée en ondelette

La transformée s’effectue sur chaque tuile de chaque composante. Elle s’effectue sur une grille dyadique, i.e. chaque itération des filtres d’analyse est suivie d’une décimation par 2. Elle décompose l’image en $3 N L + 1$ sous-bandes où $N L$ est le nombre de niveaux de décomposition (le nombre d’itérations des filtres d'analyse). La norme prévoit un nombre de niveaux de décomposition maximal de 32.

Il est possible d’utiliser deux types de transformées en ondelettes dans JPEG 2000.

L’ondelette 5/3 ou de Le Gall est une ondelette dont les coefficients des filtres d’analyse sont entiers. Il y a 5 coefficients pour le filtre passe-bas et 3 pour le passe-haut. Ces filtres permettent une reconstruction parfaite et peuvent être utilisés pour une compression sans pertes.
L’ondelette 9/7 ou de Daubechies est à coefficients réels, avec 9 coefficients pour le passe-bas et 7 pour le passe-haut. Elle permet de meilleures performances que la 5/3 en termes de compression mais est aussi plus complexe.

JPEG 2000 permet l’implémentation de ces filtres soit par une classique convolution ou par la méthode du « lifting ».

Découpage en tuiles

Dans certains cas, il peut être intéressant de découper l’image en tuiles (de l’anglais tile : tuile, carreau). Il s’agit simplement d’un découpage rectangulaire de l’image, découpage à spécifier, qui est généralement utilisé pour compresser des images de grande taille. Les tuiles sont alors un moyen de réduire la complexité mémoire pour le codeur comme pour le décodeur, en travaillant sur des sous-images indépendantes. Les tuiles peuvent avoir un impact visuel : on perçoit parfois les bornes des tuiles (lignes horizontales et verticales sur l’image).

Par défaut, l’image entière est considérée comme une seule tuile.

Quantification

Le standard JPEG 2000 utilise un quantificateur scalaire uniforme à zone morte. La quantification vectorielle bien que théoriquement plus performante est considérée comme trop coûteuse. Le quantificateur scalaire uniforme est au contraire extrêmement simple d’implémentation et peu coûteux.

L’intérêt de la zone morte provient des très nombreux coefficients ondelettes non-nuls mais proches de zéro. Ces coefficients n’apportent que très peu d’information pertinente, et leur codage entropique impliquerait un important surcoût au vu de la qualité gagnée. La zone morte permet donc de se débarrasser de ces coefficients en les quantifiant à zéro.

Codage entropique

Le codage entropique s'effectue indépendamment sur un code-bloc, un ensemble de coefficients d'ondelettes quantifiés d'une sous-bande. Le codage est constitué de deux étapes.

La première étape est l'algorithme EBCOT (Embedded Block Coding with Optimal Truncation), inventé en 1998 par David Taubman^[1]. Cet algorithme est un codeur par plan de bits. Chaque plan est encodé en trois passes : une passe de propagation de la signifiance (Significance Propagation), une passe d’affinage de l’amplitude (Magnitude Refinement), et une passe de nettoyage (Cleanup).

La deuxième étape consiste en un codage arithmétique de la sortie EBCOT, par un codeur arithmétique dit codeur-MQ.

Cette partie de la norme est la plus consommatrice en CPU^{[réf. nécessaire]}.

Allocation de débit

Cette fonction peut varier fortement d'un algorithme de codage à un autre suivant les performances et fonctionnalités escomptées pour le codeur. Néanmoins tous les algorithmes d'allocation de débit ont pour but commun la création de paquets de données tels qu'ils sont définis dans la norme.

Chaque paquet correspond à une certaine couche (généralement associé au concept de qualité) d'un niveau de résolution d'une composante de l'image. Il est constitué d'un en-tête identifiant son contenu et permettant un accès aléatoire rapide dans le codestream, ainsi que de données compressées obtenues par concaténation d'un certain nombre de coding passes de code-blocks d'un même niveau de résolution. Afin d'obtenir des taux de compression élevés, les dernières coding passes d'un code-block sont souvent sautées. Ce dernier cas revient plus ou moins à changer le pas de quantification, et donc à diminuer la précision des coefficients dont les bits de poids les plus faibles ont été évincés.

Enfin chaque paquet est ajouté au codestream à la suite d'un en-tête (regroupant tous les paramètres de codage) et suivant un ordre d'inclusion dépendant du type de progression désiré (ex: par résolution, par couche). Rappelons tout de même qu'il est toujours possible de modifier la progression au moment de la transmission, à partir d'un même codestream stocké côté serveur. Ainsi, suivant l'ordre dans lequel le décodeur reçoit les paquets, il est capable de reconstruire une image progressivement par résolution ou par couche.

Mise en forme et syntaxe

Dans la terminologie JPEG 2000 un paquet est constitué d'un en-tête et du regroupement des données entropiques associées à une tuile, une couche de qualité, une composante, une résolution et un precinct. Pour une image monochrome (1 composante) compressée avec les options par défaut (1 tuile, 1 precinct, 1 couche de qualité et 5 résolutions) le nombre de paquets est donc de 5.

L'ordre des paquets est important car il détermine la progressivité. Selon que l'on désire une progressivité spatiale, par couche de qualité, ou même par composante, l'ordre des paquets sera différent pour permettre un décodage progressif selon la modalité choisie.

Un paquet peut être vide, il n'y a alors pas de données entropiques qui correspondent à ce precinct particulier, dans cette couche de qualité, cette composante et cette résolution. Ceci peut arriver sur de petites images sur-découpées par des tuiles et des precincts.

Régions d'intérêt

Une région d’intérêt (ROI pour Region Of Interest) est une région de l’image qui est codée avec une plus grande précision, en général parce que cette région présente un intérêt particulier (ex : visage, plaque d’immatriculation…). Cette plus grande précision se fait au détriment des autres zones de l’image qui sont alors compressées à un taux inférieur et donc dégradées. La sélection du ROI est faite par l’utilisateur, donc en général manuellement, mais il existe des algorithmes qui permettent une extraction automatique des ROI. Ces algorithmes ne font pas partie de JPEG 2000.

Résistance aux erreurs

Une originalité de JPEG 2000 est d’inclure des outils de résistance aux erreurs de transmission. Le problème vient essentiellement du codeur arithmétique car un seul bit erroné entraîne le décodage d’une mauvaise séquence.

Par défaut, le codage arithmétique agit en effet sur un code-bloc. En cas d’erreur (un seul bit erroné suffit) c’est l’ensemble du code-bloc qui est perdu. Afin de limiter les effets de ces erreurs, la norme propose plusieurs outils, dont la philosophie est essentiellement de compartimenter les mots de codes ou de réduire leur longueur afin d'éviter la propagation des erreurs ou de limiter leurs effets.

Les outils proposés sont les suivants :

Marqueur de segment: Ces marqueurs sont insérés après chaque plan de bit et sont codés arithmétiquement. Leur bon décodage indique que le plan de bit courant a été correctement décodé. Inversement, si le marqueur n’est pas trouvé, le plan de bit sera considéré comme erroné et donc supprimé.
Terminaison à chaque passe: C’est un moyen de limiter la propagation des erreurs, en compartimentant les données de façon fine (à chaque passe). Le décodeur arithmétique peut ainsi continuer le décodage en cas d’erreur.
Marqueur de resynchronisation (SOP/EPH): Ces deux marqueurs indiquent le début et la fin de chaque paquet et permettent au décodeur de se synchroniser grâce au numéro de paquet inclus dans ces marqueurs. Il s’agit ici de marqueurs de syntaxe (non codés arithmétiquement) et dont la gestion est propre à chaque décodeur.

Ces outils ne suffisent pas pour une transmission sans fil. Des méthodes spécifiques ont été développées dans la partie 11 du standard, JPEG 2000 Wireless (JPWL).

Bibliographie

David Taubman, Michael Marcellin, JPEG2000 Image Compression Fundamentals, Standards and Practice,

Series : The International Series in Engineering and Computer Science, 2002, 800 p., ISBN 079237519X

Voir aussi

OpenJPEG, bibliothèque open-source permettant l'encodage et le décodage des images au format JPEG 2000.

Notes et références

↑ Davis Taubman, High performance scalable image compression with EBCOT, IEEE Transactions on Image Processing, Volume 9, Issue 7, Juillet 2000

Liens externes

Wikibooks propose un ouvrage abordant ce sujet : Le format JPEG 2000.

(fr) Site officiel
(en) The JasPer Project Home Page - University of Victoria, codec de référence open source implémenté en C
(en) JJ2000 - codec de référence open source implémenté en Java
(en) Kakadu Software - codec C++ développé par David Taubman
(en) Everything you always wanted to know about JPEG 2000 - Sept 2008 - published by intoPIX

Formats de compression multimédia

Compression vidéo

ISO/CEI	MJPEG · Motion JPEG 2000 · MPEG-1 · MPEG-2 · MPEG-4 ASP · MPEG-4/AVC
UIT-T	H.120 · H.261 · H.262 · H.263 · H.264
Autres	AMV · AVS · Bink · Dirac · Indeo · Pixlet · RealVideo · RTVideo · SheerVideo · SmackerSmacker · Snow · Theora · VC-1 · VP6 · VP7 · VP8 · WMV

Compression audio

ISO/CEI	MPEG-1 Layer III (MP3) · MPEG-1 Layer II · MPEG-1 Layer I · AAC · HE-AAC
UIT-T	G.711 · G.719 · G.722 · G.722.1 · G.722.2 · G.723 · G.723.1 · G.726 · G.728 · G.729 · G.729.1 · G.729a
Autres	AC3 · AMR · Apple Lossless · ATRAC · CELT · FLAC · iLBC · Monkey's Audio · μ-law · Musepack · Nellymoser · OptimFROG · RealAudio · RTAudio · SHN · Siren · Speex · TAK · Vorbis · WavPack · WMA

Compression d'image

ISO/CEI/UIT-T	JPEG · JPEG 2000 · JPEG-LS · JBIG · JBIG2 · PNG · WBMP
Autres	BMP · GIF · ICER · ILBM · PCX · PGF · TGA · TIFF · JPEG XR / HD Photo

Format conteneur

Général	3GP · ASF · AVI · Bink · DMF · DPX · FLV · Matroska · MP4 · MXF · NUT · Ogg · Ogg Media · QuickTime · RealMedia · Smacker · RIFF · Vob
Audio	AIFF · AU · WAV · BWF · CAF

Série JPEG
Groupe JPEG	JFIF	JPEG-LS	JPEG	JPEG 2000	Compression par ondelettes

Portail de l’informatique

Ce document provient de « JPEG 2000 ».

Catégories : Format de données numériques | Format de fichier graphique | Norme ISO | Imagerie numérique

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article ISO 15444 de Wikipédia en français (auteurs)

Игры ⚽ Нужно решить контрольную?

Regardez d'autres dictionnaires:

Iso 216 — Dimensions ISO 216 (mm × mm) Séries A A0 841 × 1189 A1 594 × 841 A2 420 × 594 A3 297 × 420 A4 210 × 297 A5 148 × 210 A6 … Wikipédia en Français
ISO 3166-1 — est une des parties de la norme ISO 3166. Publiée pour la première fois en 1974 par l’ISO, elle attribue 3 codes pour les pays du monde : ISO 3166 1 alpha 2 : codes à deux lettres pour de nombreuses applications, notamment les domaines… … Wikipédia en Français
ISO 4217 — (ИСО 4217) Коды для представления валют и фондов Codes for the representation of currencies and funds (англ.) Codes pour la représentation des monnaies et types de fonds (фр.) … Википедия
ISO 3166-1 — ISO 3166 1 часть стандарта ISO 3166, содержащая коды названий стран и подчинённых территорий. Впервые опубликована в 1974 году. Определяет три разных кода для каждой страны: ISO 3166 1 alpha 2 (англ.)русск., двухбуквенная система … Википедия
ISO 8601 — Data elements and interchange formats – Information interchange – Representation of dates and times is an international standard covering the exchange of date and time related data. It was issued by the International Organization for… … Wikipedia
ISO/CEI 8859 — ISO 8859 ISO 8859, également appelée plus formellement ISO/CEI 8859, est une norme commune de l ISO et de la CEI de codage de caractères sur 8 bits pour le traitement informatique du texte. Le standard est divisé en parties numérotées publiées… … Wikipédia en Français
ISO/IEC 8859 — ISO 8859 ISO 8859, également appelée plus formellement ISO/CEI 8859, est une norme commune de l ISO et de la CEI de codage de caractères sur 8 bits pour le traitement informatique du texte. Le standard est divisé en parties numérotées publiées… … Wikipédia en Français
ISO 10646 — ISO/CEI 10646 Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC (compatibilité) NFKD (compatibilité) Propriétés et algorithmes ISO 15924 … Wikipédia en Français
ISO 646 — Unicode Jeux de caractères UCS (ISO/CEI 10646) ISO 646, ASCII ISO 8859 1 WGL4 UniHan Équivalences normalisées NFC (précomposée) NFD (décomposée) NFKC (compatibilité) NFKD (compatibilité) Propriétés et algorithmes ISO 15924 … Wikipédia en Français
ISO 8859 — ISO 8859, également appelée plus formellement ISO/CEI 8859, est une norme commune de l ISO et de la CEI de codage de caractères sur 8 bits pour le traitement informatique du texte. Le standard est divisé en parties numérotées publiées séparément … Wikipédia en Français

Dictionnaires et Encyclopédies sur 'Academic'

ISO 15444

JPEG 2000

Sommaire

Principe général