- Échantillon (statistiques)
-
Pour les articles homonymes, voir Échantillon.
Sommaire
En statistique la notion d’échantillon désigne un sous ensemble d'individus extraits d'une population initiale, sur lesquels vont être étudiées des grandeurs aléatoires. Le recours à un échantillon répond en général a la nécessité pratique (manque de temps, de place, évaluation destructive d'une production...) ou économique (coût trop élevé) de s'abstraire de l'étude exhaustive de la population.
L'acte de sélection s'appelle l'échantillonnage. Comme il s'agit en général, à partir des résultats ou mesures obtenus sur l'échantillon, d'être en mesure d'inférer des conclusions sur la population tout entière, la théorie statistique s'est intéressée aux principes d'échantillonnage garantissant la qualité des conclusions étendues :
- capacité à capter la diversité du phénomène étudié ;
- absence de biais ou erreur systématique ;
- lien entre la taille de l'échantillon et la confiance que l'on peut accorder à la généralisation des résultats...
sont quelques-unes des préoccupations de la théorie de l'échantillonnage.
Méthode
Les statisticiens supposent la population d'une taille donnée et lui associent une loi de probabilité, c'est le rôle de l'inférence statistique ou statistique mathématique. Dans ces conditions, l'échantillon est interprété comme un ensemble de variables aléatoires dont on possède une réalisation supposée issue de tirages indépendants. L'analyse des propriétés de l'échantillon permet d'estimer certaines caractéristiques de la population, de déterminer la validité de ces estimations ou de certaines hypothèses.
Dans les sondages d'opinion la théorie statistique obligerait à tenir à jour la liste des membres de la population, tirer au sort les heureux élus et interroger ceux-ci à l'exclusion de tous les autres. C'est évidemment impossible et les instituts tentent de bâtir ce qu'ils nomment un échantillon représentatif. Celui-ci doit obéir à un certain nombre de règles afin de s'assurer de sa représentativité qui exige l'indépendance des réponses. Le problème concerne la validité d'un tel choix. Il semblerait que, mieux elle est assurée, plus on se rapproche d'un sondage aléatoire avec ses limites parfaitement déterminées par la théorie (une enquête effectuée sur 1000 personnes a 95 chances sur 100 de donner le résultat correct à ±3% près, d'après le calcul de l'intervalle de fluctuation). Selon la plupart des instituts leurs résultats seraient meilleurs, ce qui demanderait quelques justifications.
Voir aussi
Articles connexes
- Portail des probabilités et des statistiques
- Portail de la sociologie
Wikimedia Foundation. 2010.