- Analyse exploratoire de données
-
Analyse des données
L’analyse des données est un sous domaine des statistiques qui se préoccupe de la description de données conjointes. On cherche par ces méthodes à donner les liens pouvant exister entre les différentes données et à en tirer une information statistique qui permet de décrire de façon plus succincte les principales informations contenues dans ces données. On peut également chercher à classer les données en différents sous groupes plus homogènes.
Par exemple l’âge, le sexe et la catégorie socioprofessionnelle des joueurs de golf peuvent être étudiés simultanément.
Les principales méthodes de l’analyse des données sont :
- L’analyse en composantes principales (ACP), utilisée pour des données quantitatives.
- L’analyse factorielle discriminante (AFD) ou analyse discriminante qui permet d’identifier des groupes homogènes au sein de la population du point de vue des variables étudiées,
- L'analyse factorielle des correspondances (AFC), utilisée pour des données qualitatives (tableau d’association).
- La classification automatique.
- L’analyse en composantes indépendantes (ACI).
- L'iconographie des corrélations.
Ces méthodes permettent notamment de manipuler et de synthétiser l’information provenant de tableaux de données de grande taille.
Pour cela, il est très important de bien estimer les corrélations entre les variables que l’on étudie. On a alors souvent recours à la matrice des corrélations (ou la matrice de variance-covariance) entre les variables.
Les pères de l’analyse des données sont :
- Jean-Paul Benzécri
- John Tukey (sous le terme de Exploratory Data Analysis, ou EDA)
- Chikio Hayashi (sous le terme de Data Sciences)
De nombreux logiciels permettent d'effectuer de l'analyse des données directe ou indirecte.
Références
- (fr) Benzécri J.-P. et al. (1976), L'Analyse des données, Paris, Dunod
- (en) The Collected Works of John W. Tukey (ISBN 0412063212) ; (ISBN 0534051014)
- (en) J W Tukey, Graphical Analysis of Multiresponse Data, K E Basford (ISBN 0849303842)
- (fr) Michel Volle, Analyse des données, Economica, 4e édition, 1997 (ISBN 2717832122)
- (fr) Jean-Marie Bouroche et Gilbert Saporta, L'Analyse des données, P.U.F , 8e édition, 2002 (ISBN 2 13 052495 8)
Liens internes
Liens externes
- Portail des probabilités et des statistiques
- Portail de l’informatique
Catégories : Statistiques | Intelligence artificielle | Analyse des données
Wikimedia Foundation. 2010.