- CHAID
-
CHAID (CHi-squared Automatic Interaction Detector) est une technique de type arbre de décision. Elle a été publiée, en 1980, par Gordon V. Kass[1]. Elle peut être utilisée pour la prédiction (comme la régression linéaire) ou pour la détection d'interaction entre variables.
En pratique, elle est souvent utilisée en marketing direct pour sélectionner un groupe de consommateurs et prédire leurs réponses à certaines variables et comment ils affectent d'autres variables.
Comme avec les autres arbres de décision, ces avantages sont un résultat essentiellement visuel et facilement interprétable. À cause de la segmentation de la population lors de l'analyse, l'échantillonnage doit être suffisamment large de manière à ce que la taille de chaque groupe ne devienne pas trop petite, ce qui rendrait l'analyse peu fiable.
CHAID détecte l'interaction entre variables dans un jeu de données. En utilisant cette technique on peut établir des relations de dépendance entre variables. En prenant la lecture d'un journal, par exemple, il sera possible d'étudier l'influence de variables explicatives comme le prix, la taille, les suppléments etc. CHAID opère cela par l'identification de groupes discrets puis en prenant le lien aux variables explicatives cherchant quel serait l'impact sur la variable initiale.
CHAID est souvent utilisé comme technique d'exploration et est une alternative aux multiples régressions, en particulier quand le jeu de données n'est pas parfaitement adapté aux analyses par régression.
Sommaire
ECHAID
L'algorthme CHAID[2] se déroule en trois étapes :
- préparation des prédicteurs
- fusion des classes
- sélection de la variable de séparation
Dans cette dernière étape, l'algorithme utilise les Probabilités pour estimer si une catégorie peut être divisée. L'algorithme « Exhaustive » CHAID (ECHAID) utilise une technique plus complexe à cette même fin.
Voir aussi
Références
- G. V. Kass. An Exploratory Technique for Investigating Large Quantities of Categorical Data. Journal of Applied Statistics, Vol. 29, No. 2 (1980), pp. 119-127.
- Robert Nisbet, John Elder, Gary Miner, Handbook for Statistical Analysis And Data Mining, Accademic Press, Page 247 Edition 2009
Liens externes
- (en) Analyse CHAID
- (en) Arbre de décision
- (en) Techniques d'analyse
- Portail des probabilités et des statistiques
Catégories :- Heuristique
- Algorithme d'exploration de données
Wikimedia Foundation. 2010.