Classification Automatique

Classification Automatique

Classification automatique

On appelle classification automatique la catégorisation algorithmique d'objets. Celle-ci consiste à attribuer une classe ou catégorie à chaque objet (ou individu) à classer, en se basant sur des données statistiques. Cela fait couramment appel à l'apprentissage automatique et est largement utilisé en reconnaissance de formes.

Sommaire

Fondements

Nos moyens limités d'entendement nous obligent, pour tenter de comprendre quelque chose au réel, à effectuer des classifications des objets que nous devons traiter en catégories. Celles-ci ont été considérées par la philosophie :

  • au départ comme préexistantes à l'observation. C'est la démarche dite platonicienne où l'on considère que les catégories en question préexistent à l'entendement humain, qui ne fait que les découvrir plus ou moins imparfaitement. Cette démarche subsista grosso modo jusqu'à la fin du Moyen Âge, où elle était curieusement désignée sous le nom de réalisme.
  • par la suite estimées comme des regroupements ad hoc et ne visant qu'à la commodité d'usage : il n'existerait pas en soi de « champignons comestibles » et de « champignons vénéneux », mais l'effet observé des champignons nous aurait conduits à les classer fonctionnellement en comestibles et en vénéneux. Cette démarche opposée au réalisme du Moyen Âge fut nommée nominalisme. Bertrand Russell fait remarquer dans ses ouvrages que si l'on devait les nommer aujourd'hui, on permuterait les deux appellations.

La classification automatique vise à créer ces catégories à partir de procédés ne faisant intervenir que les données et pas la subjectivité de l'expérimentateur. Il serait d'ailleurs plus exact de dire : « ne faisant pas intervenir la subjectivité de l'expérimentateur par autre chose que le choix des représentations qu'il utilise » : si l'on classifie des objets en considérant leur plus grande dimension, on n'obtiendra pas en général le même classement qu'en les classifiant par leurs poids.

Bien que les premières bases de l'approche algorithmique de la classification automatique soient relativement anciennes, ce n'est qu'avec le développement de l'informatique que celles-ci sont devenues possibles à mettre en œuvre sur de grands échantillons de données. Le résultat d'une classification peut être soit une partition mathématique soit une hiérarchie (mathématiques).

Méthodes

Parmi les différentes méthodes, on peut considérer deux grands types d'approches.

Non paramétriques

Les approches dites non paramétriques (classification hiérarchique, méthode des centres mobiles) ne considèrent qu'une seule hypothèse : plus deux individus sont proches, plus ils ont de chances de faire partie de la même classe.

Probabilistes

La seconde grande famille de méthodes de classification automatique, dites probabilistes, utilise une hypothèse sur la distribution des individus à classifier. Par exemple, on peut considérer que les individus de chacune des classes suivent une loi normale. Le problème qui se pose alors est de déterminer quels sont les paramètres des lois (moyenne, variance) et à quelle classe les individus ont le plus de chances d'appartenir. Les paramètres d'une loi peuvent être déterminés de maintes façons, et notamment en utilisant l'algorithme espérance-maximisation.

Liens internes

Ce document provient de « Classification automatique ».

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Classification Automatique de Wikipédia en français (auteurs)

Игры ⚽ Поможем написать курсовую

Regardez d'autres dictionnaires:

  • Classification automatique — ● Classification automatique ensemble de méthodes permettant, à l aide d algorithmes, de construire sur un ensemble d individus une série de partitions emboîtées les unes dans les autres …   Encyclopédie Universelle

  • Classification automatique — On appelle classification automatique la catégorisation algorithmique d objets. Elle consiste à attribuer une classe ou catégorie à chaque objet (ou individu) à classer, en se basant sur des données statistiques. Elle fait couramment appel à l… …   Wikipédia en Français

  • classification — [ klasifikasjɔ̃ ] n. f. • 1752; de classifier ♦ (Abstrait) Action de distribuer par classes, par catégories; résultat de cette action. ⇒ classement; division. Science des classifications. ⇒ systématique, taxinomie. Classification dichotomique.… …   Encyclopédie Universelle

  • Classification — Une classification ou système de classification est un système organisé et hiérarchisé de catégorisation d « objets ». Suivant les objets considérés (les espèces vivantes, les maladies, les produits ou services, les étoiles, les… …   Wikipédia en Français

  • Classification double — La Classification double ou « Biclustering » est une technique d exploration de données non supervisée permettant de segmenter simultanément les lignes et les colonnes d une matrice. Plus formellement[1], la définition de la… …   Wikipédia en Français

  • Classification et catégorisation de documents — La classification et catégorisation de documents est l activité du Traitement automatique des langues naturelles qui consiste à classer de façon automatique des ressources documentaires, généralement en provenance d un corpus. Cette… …   Wikipédia en Français

  • Classification chaotique — Le classement chaotique combine des outils d indexation automatique avec un classement chronologique des originaux et permet de retrouver un document parmi un ensemble de documents non ordonnés. L application la plus utile permet de retrouver un… …   Wikipédia en Français

  • Classification sous contrainte — En intelligence artificielle, la classification sous contrainte désigne une famille d algorithmes d apprentissage semi supervisée. Cette dernière occupe une place intermédiaire entre l apprentissage supervisé (pour laquelle les étiquettes de… …   Wikipédia en Français

  • Classification naïve bayesienne — La classification naïve bayésienne est un type de classification Bayésienne probabiliste simple basée sur le théorème de Bayes avec une forte indépendance (dite naïve) des hypothèses. Elle met en œuvre un classifieur bayésien naïf, ou classifieur …   Wikipédia en Français

  • Classification Musicale — Musique Allégorie évoquant la musique et les instruments La musique est l art consistant à arranger et ordonner sons et silences au cours du temps : le rythme est le support de cette combinaison dans le temps, la hauteur celle de la… …   Wikipédia en Français

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”