Niveau de confiance

Intervalle de confiance

En statistiques, et en particulier dans la théorie des sondages, lorsqu'on cherche à estimer la valeur d'un paramètre, on parle d'intervalle de confiance lorsque l'on donne un intervalle qui contient, avec un certain degré de confiance, la valeur à estimer. Le degré de confiance est en principe exprimé sous la forme d'une probabilité. Par exemple, un intervalle de confiance à 95% (ou au seuil de risque de 5%) a une probabilité égale à 0,95 de contenir la valeur du paramètre que l'on cherche à estimer.

Ainsi, lorsqu'on effectue un sondage (tirage au hasard d'un sous-ensemble d'une population), l'estimation d'une quantité d'intérêt donnée est soumise au hasard et correspond rarement exactement à la valeur de la quantité que l'on cherche à estimer. En présentant pour l'estimation non pas une valeur mais un encadrement, on quantifie d'une certaine manière l'incertitude sur la valeur estimée.

Plus l'intervalle de confiance est de taille petite, plus l'incertitude sur la valeur estimée est petite. L'un des objectifs de la théorie des sondages consiste à trouver des méthodes permettant de donner des intervalles de confiance de taille raisonnable.

Sommaire

1 Exemple I : Estimation d'une moyenne
2 Exemple II : le sondage d'opinion
3 De façon plus générale
4 Voir aussi
- 4.1 Notes et références
- 4.2 Articles connexes

Exemple I : Estimation d'une moyenne

L'usage le plus simple des intervalles de confiance concerne les populations à distribution normale (en forme de cloche) dont on cherche à estimer la moyenne $\overline X$ . Si on connait l'écart type $σ(X)$ (ou si on en connait une estimation assez fiable) de cette distribution, et si on mesure la moyenne $\overline x$ sur un échantillon de taille n pris au hasard, alors

l'intervalle $\left[\overline x - \frac{\sigma(X)}{\sqrt n}; \overline x + \frac{\sigma(X)}{\sqrt n}\right]$ est un intervalle de confiance de $\overline X$ à environ 68 %
l'intervalle $\left[\overline x -2 \frac{\sigma(X)}{\sqrt n}; \overline x + 2\frac{\sigma(X)}{\sqrt n}\right]$ est un intervalle de confiance de $\overline{X}$ à environ 95 % ^[1]
l'intervalle $\left[\overline x - 3\frac{\sigma(X)}{\sqrt n}; \overline x + 3\frac{\sigma(X)}{\sqrt n}\right]$ est un intervalle de confiance de $\overline X$ à environ 99,7%

Encore faut-il connaitre ou avoir une estimation de l'écart type $σ(X)$ . En pratique, on prend comme estimation de $σ(X)$ la valeur $s\,$ où $s\,$ est l'écart-type de la série de mesures issues de l'échantillon.

Ainsi l'on voit que pour augmenter la confiance, il faut élargir l'intervalle et pour obtenir un intervalle plus fin avec même degré de confiance, il faut augmenter la taille de l'échantillon.

Exemple II : le sondage d'opinion

On cherche à estimer le pourcentage de personnes ayant une voiture verte. Pour cela on effectue un sondage. Comme on ne sonde pas toute la population on a de bonnes chances de ne pas tomber exactement sur la bonne valeur mais de faire une erreur. On veut alors donner un intervalle qui a 95% de chances de contenir la vraie valeur.

Pour cela on effectue un sondage sur 1 000 personnes. Les résultats sont les suivants: 150 personnes ont une voiture verte, 850 n'en ont pas.

On appelle p la "vraie" proportion de personnes dans la population totale qui ont une voiture verte. On cherche à estimer p. On appelle N le nombre de personnes ayant été sondées, ici N=1 000. On appelle S le nombre de personnes ayant une voiture verte parmi les N personnes sondées. L'idée est de présenter comme estimation de p la valeur S/N.

On applique le théorème central limite à la variable aléatoire X_i qui vaut 1 si la i-ème personne sondée a une voiture verte et 0 sinon. Cette variable a une moyenne p et une variance p(1-p). Alors:

$\frac{S-Np}{\sqrt{Np(1-p)}}$ tend vers une loi normale de moyenne 0 et de variance 1.

Pour une loi normale de moyenne 0 et de variance 1 on a : P(−1,96 < Z < 1,96) = 0,95. La valeur 1,96 est le quantile d'ordre 1-2,5% de la loi normale. Ces valeurs peuvent se trouver dans des tables de quantiles ou être calculées à partir de la fonction d'erreur réciproque: $q = \sqrt{2}\ erf^{-1}(P)$ par exemple, $\sqrt{2}\ erf^{-1}(0.95) = 1.9599...$ (voir par exemple les quantiles de la loi de Student pour un exemple de table de quantile.)

$P\left(-1,96<\frac{S/N-p}{\sqrt{p(1-p)/N}}<1,96\right)=0,95.$

Soit encore

$P\left(\frac SN-1,96\sqrt{p(1-p)/N}<p<\frac SN + 1,96\sqrt{p(1-p)/N}\right)=0,95.$

En estimant $\sqrt{p(1-p)}$ par $\sqrt{(S/N)(1-(S/N))}$ on peut alors encadrer p:

Pourquoi l'on peut bien faire cette estimation

En fait si on appelle $\overline{\sigma}=\sqrt{\frac{N}{N-1}\frac{S}{N}\left(1-\frac{S}{N}\right)}$ l'estimateur de la variance constatée, la variable $\frac{S-Np}{N\overline{\sigma}}$ suis une loi de Student à N-1 degrés de libertés. Ici (N-1)=999 les quantiles d'ordre 999 de la loi de student sont les mêmes d'un point de vue numérique que celles d'ordre infini qui correspondent à la loi normale. On peut donc remplacer la variance par l'estimateur de la variance constatée.

Ensuite l'on peut remplacer $\overline{\sigma}\approx\sqrt{\frac{S}{N}\left(1-\frac{S}{N}\right)}$ l'erreur en pourcentage sur la variance constatée en ommetant la normalisation N/(N-1) pour N = 1 000 est de l'ordre de 5/10000 que l'on néglige pour ne pas allourdir la présentation.

$P\left(\frac{S}{N}-1,96\sqrt{\frac{(S/N)(1-(S/N))}{N}}<p<\frac{S}{N}+1,96\sqrt{\frac{(S/N)(1-(S/N))}{N}}\ \right)=0,95.$

L'intervalle de confiance à 95 % vaut alors [0,127;0,172]. On est sûr à 95% qu'entre 12,7% et 17,2% de personnes ont une voiture verte avec ce sondage.

Pour avoir une plus grande précision, il faudrait sonder plus de personnes. On remarque en effet l'existence d'un N apparaissant au dénominateur des deux racines carrées. Si on sonde plus de personnes (N plus grand), ces deux termes auront tendance à devenir plus petits et l'intervalle sera plus petit.

De façon plus générale

L'intervalle de confiance mesure le degré de précision que l'on a sur les estimations issues de l'échantillon. Il y a deux sources principales de variations sur les données qui peuvent être la cause d'un manque de précision dans l'estimation d'une grandeur.

Un nombre insuffisant de données: par exemple, dans le cas d'un sondage, on ne sonde pas toute la population mais qu'une fraction de la population. De même, pour les mesures physiques, on n'effectue qu'un nombre fini de mesures alors qu'il faudrait souvent en théorie pouvoir en faire une infinité pour obtenir un résultat parfait.
Il peut également y avoir du bruit dans la mesure des données ce qui est pratiquement toujours le cas pour la mesure des grandeurs physiques.

Parmi les méthodes d'estimation, nous pouvons citer l'estimation par intervalle de confiance. Il s'agit de trouver un intervalle contenant un paramètre (inconnu) à estimer avec une probabilité ou niveau de confiance de $1 - α$ . Pour p un paramètre (inconnu) à estimer on cherche par exemple a et b tels que:

$\mathbb{P}(a<p<b)=1-\alpha$

Si on appelle p la valeur exacte du paramètre , et que la valeur mesurée suit une loi de probabilité dépendant de p : $\mathbb P_p$ , l'intervalle de confiance I(x) (au « niveau de confiance » $1 - α$ ) relatif à une observation x constatée, est l'intervalle dans lequel, pour toute valeur p,

$\mathbb{P}_p(x : p \in I(x)) \geq 1-\alpha$ .

Pour un p donné, c'est la probabilité d'observer une valeur x pour laquelle le paramètre à estimer soit dans l'intervalle de confiance associé à cette observation x.

Ceci ne signifie pas que « la probabilité que la valeur réelle soit dans I(x) est $1 - α$ », ce qui n'aurait pas de sens puisque la valeur réelle n'est pas une variable aléatoire. Cela signifie que « si la valeur réelle n'est pas dans I(x), la probabilité a priori du résultat de l'observation que l'on a obtenu était inférieure à α ». Par exemple si le paramètre n'est pas dans l'intervalle, c'est que l'observation effectuée correspond à un phénomène "rare" dans lequel l'intervalle de confiance ne contient pas la vraie valeur.

Voir aussi

Notes et références

↑ l'intervalle de confiance à 95% est plus précisément $\left]\overline x - 1,96\frac{\sigma(X)}{\sqrt n}; \overline x + 1,96\frac{\sigma(X)}{\sqrt n}\right[$

Regardez d'autres dictionnaires:

niveau de confiance — pasikliovimo lygis statusas T sritis automatika atitikmenys: angl. confidence level vok. Vertrauenswert, m rus. доверительный уровень, m pranc. niveau de confiance, m … Automatikos terminų žodynas
niveau de confiance — pasikliovimo lygis statusas T sritis Standartizacija ir metrologija apibrėžtis Tikimybė, kad matavimo rezultatų vertė yra pasikliaujamųjų verčių intervale. atitikmenys: angl. confidence coefficient; confidence level vok. Sicherheitsniveau, n;… … Penkiakalbis aiškinamasis metrologijos terminų žodynas
niveau de confiance — pasikliovimo lygis statusas T sritis Standartizacija ir metrologija apibrėžtis Tikimybė, kad tikroji dydžio vertė yra tarp apibrėžtų pasikliovimo ribų; sistemingoji paklaida priimama kaip nereikšminga. Tai dažniausiai būna pateikiama procentais,… … Penkiakalbis aiškinamasis metrologijos terminų žodynas
niveau de confiance — pasikliovimo lygis statusas T sritis fizika atitikmenys: angl. confidence level; degree of confidence vok. Gewißheitsgrad, m rus. степень достоверности, f; уровень достоверности, f pranc. niveau de confiance, m … Fizikos terminų žodynas
confiance — [ kɔ̃fjɑ̃s ] n. f. • XVe; confience XIIIe; du lat. confidentia, d apr. l a. fr. fiance « foi » 1 ♦ Espérance ferme, assurance de celui qui se fie à qqn ou à qqch. ⇒ créance, foi, sécurité. Avoir confiance, une confiance absolue, inébranlable,… … Encyclopédie Universelle
Confiance (politique) — Pour les articles homonymes, voir Confiance (homonymie). En démocratie, la confiance et plus généralement la légitimité sont requises pour qu un gouvernement puisse conserver le pouvoir. Dans la plupart des démocraties parlementaires, la… … Wikipédia en Français
Confiance(album) — Confiance (album) Confiance est un album de Michel Rivard édité au Québec en novembre 2006 par L Équipe Spectra et les Productions Sauvages. Le disque, réalisé en solo, est le premier album studio de Rivard depuis Maudit Bonheur en 1998. Sommaire … Wikipédia en Français
Confiance (homonymie) — Cette page d’homonymie répertorie les différents sujets et articles partageant un même nom. La Confiance peut désigner un état d esprit accordé : par une personne qui s en remet à quelqu un ou à quelque chose, sans crainte particulière … Wikipédia en Français
Confiance (album) — Pour les articles homonymes, voir Confiance (homonymie). Confiance est un album de Michel Rivard édité au Québec en novembre 2006 par L Équipe Spectra et les Productions Sauvages. Le disque, réalisé en solo, est le premier album studio de Rivard… … Wikipédia en Français
Confiance en la science — Science Pour les articles homonymes, voir Science (homonymie). Prométhée apportant le feu a … Wikipédia en Français

Dictionnaires et Encyclopédies sur 'Academic'

Niveau de confiance

Intervalle de confiance

Sommaire

Exemple I : Estimation d'une moyenne

Exemple II : le sondage d'opinion

De façon plus générale

Voir aussi

Notes et références

Articles connexes

Regardez d'autres dictionnaires:

Share the article and excerpts

Dictionnaires et Encyclopédies sur 'Academic'

Wikipédia en Français

Niveau de confiance

Intervalle de confiance

Sommaire

Exemple I : Estimation d'une moyenne

Exemple II : le sondage d'opinion

De façon plus générale

Voir aussi

Notes et références

Articles connexes

Regardez d'autres dictionnaires:

Share the article and excerpts

Direct link