- Histogramme (imagerie numérique)
-
Pour l’article homonyme, voir Histogramme.
En imagerie numérique, l’histogramme représente la distribution des intensités (ou des couleurs) de l'image. C'est un outil fondamental du traitement d'images, avec de très nombreuses applications. Les histogrammes sont aussi très utilisés en photographie et pour la retouche d'images.
Sommaire
Définition
Pour une image monochrome, c'est-à-dire à une seule composante, l'histogramme est défini comme une fonction discrète qui associe à chaque valeur d'intensité le nombre de pixels prenant cette valeur. La détermination de l'histogramme est donc réalisée en comptant le nombre de pixel pour chaque intensité de l'image. On effectue parfois une quantification, qui regroupe plusieurs valeurs d'intensité en une seule classe, ce qui peut permettre de mieux visualiser la distribution des intensités de l'image.
Les histogrammes sont en général normalisés, en divisant les valeurs de chaque classe par le nombre total de pixels de l'image. La valeur d'une classe varie alors entre 0 et 1, et peut s'interpréter comme la probabilité d'occurrence de la classe dans l'image. L'histogramme peut alors être vu comme une densité de probabilité[1]. Pour une image {x} en niveaux de gris codée sur L niveaux, on définit nk le nombre d'occurrences du niveau xk. La probabilité d'occurrence d'un pixel de niveau xk dans l'image est:
avec n le nombre total de pixels de l'image, et px définit alors l'histogramme normalisé sur [0,1].
On définit également l'histogramme cumulé, somme partielle des probabilité d'occurrence :
Il peut s'interpréter comme la fonction de répartition associée à la variable aléatoire {x}.
Pour les images couleurs, on peut considérer les histogrammes des 3 composantes indépendamment, mais cela n'est en général pas efficace[2]. On construit plutôt un histogramme directement dans l'espace couleur. Les classes de l'histogramme correspondent désormais à une couleur (ou un ensemble de couleurs, en fonction de la quantification), plutôt qu'à une intensité. On parle alors parfois d'histogramme de couleur.
Un histogramme peut être construit dans n'importe quel espace de couleurs, (RVB, HSV), ou sous-ensemble de cet espace, ainsi que pour les images multispectrales ou hyperspectrales .
Il est également possible de ne calculer l'histogramme que sur une partie de l'image, de forme arbitraire, ou au voisinage d'un point. On parle alors dans ce cas d'histogramme local.
Exemple
Exemple de construction d'un histogramme d'une image couleur, dans l'espace RGB, sur les composantes rouge et bleue uniquement: Chaque composante est quantifiée en quatre intervalles, ce qui donne un nombre de classes de 42 = 16. On peut alors représenter la table suivante par un histogramme 3D, où l'axe x représente la composante bleue, l'axe y représente la composante rouge et l'axe vertical est le nombre de pixels de chaque classe. Cet histogramme n'est pas normalisé.
Rouge 0-63 64-127 128-191 192-255 Bleu 0-63 43 78 18 0 64-127 45 67 33 2 128-191 127 58 25 8 192-255 140 47 47 13 Propriétés
Les histogrammes sont résistants à un certain nombre de transformations sur l'image. Ils sont invariants aux rotations et aux translations, ainsi que dans une moindre mesure aux changements de point de vue, et aux changements d'échelle[3]. Les histogrammes sont en revanche sensibles aux changements d'illumination et aux conditions d'éclairage.
Pour un histogramme normalisé, la valeur de chaque classe s'interprète comme la probabilité d'occurrence de la classe dans l'image. Un histogramme normalisé somme à 1.
Une propriété intéressante est leur facilité de calcul, puisqu'il ne s'agit que de comptage de pixels, ce qui se prête bien à une implémentation matérielle. Les histogrammes sont donc souvent utilisés pour des applications temps-réel[1].
Types d'histogrammes
Histogramme pondéré
Histogramme conjoint
Article détaillé : Histogramme conjoint.Histogramme intégral
L'histogramme intégral est une représentation qui permet un calcul rapide d'histogrammes locaux, dans n'importe quelle région de l'image. La méthode a été proposée en 2005, et s'inspire de la représentation proposée pour les images intégrales[4].
Traitements
Égalisation d'histogramme
Article détaillé : Égalisation d'histogramme.L'égalisation d'histogramme est une méthode d'ajustement du contraste d'une image qui utilise l'histogramme. Elle consiste à appliquer une transformation sur chaque pixel de l'image, et donc d'obtenir une nouvelle image à partir d'une opération indépendante sur chacun des pixels. Cette transformation est construite à partir de l'histogramme cumulé de l'image de départ.
L'égalisation d'histogramme permet de mieux répartir les intensités sur l'ensemble de la plage de valeurs possibles (0 à 255 en général pour des images 8 bits), en « étalant » l'histogramme. Théoriquement (cas continu) l'histogramme devrait même être plat (loi uniforme). Toutefois à cause de la discrétisation, ceci est rarement le cas[5].
L'égalisation est intéressante pour les images dont la totalité, ou seulement une partie, est de faible contraste (pixels d'intensité proches). La méthode est rapide, facile d'implémentation, et complètement automatique (i.e. pas de réglages)[5].
Spécification d'histogramme
Il n'est parfois pas pertinent de chercher à obtenir un histogramme uniforme par égalisation. La spécification d'histogramme est une méthode permettant de générer une image ayant une forme d'histogramme déterminée[6].
Si l'on souhaite obtenir un histogramme de forme pz, à partir d'une image originale à L niveaux de gris, d'histogramme px, alors la transformation est obtenue de la manière suivante:
La transformation par égalisation de l'image originale est donnée par
La transformation par égalisation de l'image souhaitée est
L'égalisation de l'image originale et l'image transformée doit aboutir au même histogramme égalisé, on a donc
- s = s' d'où z = G − 1(T(x))
L'image transformée peut donc être obtenue avec l'histogramme spécifié pz, à partir des transformations G (obtenue à partir de pz) et T (égalisation classique de l'image originale).
Mesures de similarité
Dans de nombreuses applications, il est utile de calculer une distance (ou plus généralement une mesure de similarité/dissimilarité) entre histogrammes. Par exemple pour étudier les variations temporelles du contenu visuel dans une vidéo, ou pour trouver des images similaires à une image requête. On définit pour cela un certain nombre de distances pour mesurer si deux histogrammes sont « proches » l'un de l'autre. Soit h1 et h2 deux histogrammes de même taille N (i.e. avec le même nombre de classes)
- Intersection :
- Corrélation : , où .
- Chi-2 :
De nombreuses autres mesures sont possibles, notamment la divergence de Kullback-Leibler et la distance de Bhattacharyya, puisque la comparaison d'histogrammes se ramène à une mesure de dissimilarité entre deux distributions de probabilités.
Applications
L'histogramme est un outil de base du traitement d'images et est utilisé dans de très nombreuses applications et méthodes[1].
Rehaussement d'images
L'égalisation d'histogramme, qu'il soit global, ou appliqué de manière local, est un outil très utilisé pour l'amélioration du contraste, et donc le rehaussement. De même, la spécification d'histogramme peut être utilisée le rehaussement.
Il est également possible d'utiliser les statistiques de l'histogramme (moyenne, variance) pour l'amélioration de l'intensité et du contraste[7].
Segmentation en plans
Article détaillé : Segmentation en plans.Une segmentation en plans consiste à détecter les différents plans d'une vidéo. Pour cela, une méthode consiste à calculer un histogramme pour toutes les images de la vidéo, et d'étudier ensuite les variations temporelles des distances entre histogrammes consécutif. Une distance faible étant synonyme de similarité visuelle, et une distance élevé reflétant un fort changement visuel. Les changements de plans sont alors détectés comme étant les pics de ces variations temporelles.
Les histogrammes sont la méthode privilégiée pour la segmentation, qui donne les résultats parmi les robustes, tout en étant de faible complexité[8].
Reconnaissance d'objets
L'idée a été proposée par Michael Swain et Dana Ballard en 1991[9] et est principalement utilisée dans les situations où, la rapidité du traitement de l'image est un facteur déterminant du choix de l'algorithme ou est un objet spécifique, au lieu d'être une classe d'objets abstraite qui requiert d' être identifiée ; telle que notée par Swain et Ballard : « Cela peut ne pas être utile pour modéliser une tasse de café étant rouge ou blanche, mais peut être utile pour vous.»
Ceci fournit une vue d'ensemble bien plus compacte des données dans une image que de savoir la valeur exacte de chaque pixel. L'histogramme de couleurs d'une image est invariable selon la translation ou de la rotation de l'axe de vue, et varie progressivement selon l'angle de vue. Ce qui fait que l'histogramme de couleurs est un outil particulièrement intéressant pour la reconnaissance d'objets ayant une position et une rotation inconnue par rapport à la scène.
L'inconvénient principal de cet histogramme est que la représentation obtenue dépend seulement de la couleur de l'objet étudié, par ce fait il n'y a pas de moyen de distinguer la différence entre une tasse rouge et blanche d'une autre tasse blanche et rouge. En d'autres termes, l'algorithme de l'histogramme de couleurs n'a pas d'idée générale de la tasse, seulement de son nombre de couleurs, alors on ne peut la comparer avec une tasse bleue et blanche, car les informations obtenues ne seront pas semblables.
Suivi d'objets
Photographie
L'histogramme est un outil indispensable pour beaucoup de photographes. Il permet notamment de savoir très rapidement si une photographie est bien exposée, et s'il existe des zones bouchées (noir complet) ou brûlées (blanc pur). L'histogramme permet de contrôler la qualité de l'exposition de manière objective[10].
Il est important de considérer que l'histogramme peut être analysé correctement quel que soit l'écran utilisé et ses réglages, alors que la lecture d'une image seule ne sera pas juste si l'écran utilisé n'est pas bien calibré. L'histogramme est le seul moyen de vérifier certaines informations juste après la prise de vue avec certains appareils photos reflex pour lesquels l'écran intégré est loin d'être parfait[10].
Bibliographie
- (en) Rafael C. Gonzalez, Richard E. Woods, Digital Image Processing, Pearson Prentice Hall, 2008
- (en) Anil K. Jain, Fundamentals of Digital Image Processing, 1989.
Notes et références
- Gonzalez, Woods (2008), Intensity Transformations and Spatial Filtering p. 120
- Gonzalez, Woods (2008), Color Image Processing p. 438
- MJ Swain, DH Ballard: Color Indexing, International Journal of Computer Vision, 1991, p. 13
- Conference on Computer Vision and Pattern Recognition (CVPR), June 2005 Porikli, F., "Integral Histogram: A Fast Way to Extract Histograms in Cartesian Spaces", proceedings of the IEEE
- Gonzalez, Woods (2008), Intensity Transformations and Spatial Filtering p. 127
- Gonzalez, Woods (2008), Intensity Transformations and Spatial Filtering p. 128-138
- Gonzalez, Woods (2008), Intensity Transformations and Spatial Filtering p. 140-144
- (en) John S. Boreczky and Lawrence A. Rowe, « Comparison of video shot boundary detection techniques », Storage and Retrieval for Image and Video Databases (SPIE), 1996.
- MJ Swain, DH Ballard: Color Indexing, International Journal of Computer Vision, 1991
- Chasseur d'Images, n°328, Novembre 2010, p. 112
Wikimedia Foundation. 2010.