Quantile

Quantile

Les quantiles sont des points essentiels pris à des intervalles réguliers verticaux d'une fonction de répartition d'une variable aléatoire. Diviser des données ordonnées en q sous-jeux de données de dimension essentiellement égale est la motivation des q-quantiles ; les quantiles sont les valeurs de données marquant les limites entre deux sous-jeux consécutifs.

Certains quantiles ont des noms spéciaux  :

  • Les 100-quantiles sont appelés centiles ou percentiles selon un anglicisme fréquent ;
  • Les 10-quantiles sont appelés déciles ;
  • Les 5-quantiles sont appelés quintiles ;
  • Les 4-quantiles sont appelés quartiles ;
  • Les 3-quantiles sont appelés terciles ;
  • Le 2-quantile est appelé médiane.

Certains programmes informatiques définissent le quantile minimum et le quantile maximum par respectivement le quantile d'ordre 0 et le quantile d'ordre 100. Toutefois, une telle terminologie va au-delà des définitions traditionnelles de la statistique. Pour une population infinie, le p-ième q-quantile est la valeur des données où la fonction de distribution cumulative vaut p/q. Pour un nombre fini N de tirages, il faut calculer Np/q--si ce n'est pas un entier, alors il faut arrondir à l'entier supérieur pour obtenir une valeur approchée (en supposant que les tirages sont ordonnés par valeur croissante) ; si c'est un entier alors n'importe quelle valeur depuis la valeur de ce tirage jusqu'à la valeur du prochain tirage peut être choisie pour le quantile, et conventionnellement (mais c'est tout-à-fait arbitraire) on prend la moyenne de ces deux valeurs.


Plus formellement : le p-ième q-quantile de la distribution de la variable aléatoire X peut être défini comme la valeur(s) x telle que:

P(X\leq x)\geq \frac{p}{q} \ \mathrm{ou} \  P(X\geq x)\geq \frac{q-p}{q}.

Si au lieu de prendre p et q comme des entiers, le p-quantile est basé sur un nombre réel p avec 0<p<1 alors ceci devient:

un p-quantile de la distribution de la valeur aléatoire X peut être défini comme une valeur x telle que :

P(X\leq x)\geq p \ \mathrm{ou} \  P(X\geq x)\geq 1-p.

Les résultats standardisés de tests sont communément mal interprétés: Nous disons souvent "dans le 80e centile". En fait, nous disons cela comme si le 80e centile était un intervalle dans lequel nous devions nous placer, ce qui n'est pas le cas. On peut se placer sur un quelconque centile ou entre deux centiles, mais pas dans un centile.

Si une distribution est symétrique, alors la médiane est la moyenne, mais ce n'est pas généralement le cas.

Les quantiles sont des mesures utiles parce qu'elles sont moins sensibles aux distributions allongées et aux valeurs aberrantes. Par exemple, avec une valeur aléatoire qui suit une distribution exponentielle, n'importe quel échantillon particulier de cette variable aléatoire aura approximativement une chance de 63% d'être inférieur à la moyenne. Ceci est dû à la présence d'une longue queue de la distribution exponentielle dans les valeurs positives, qui est absente dans les valeurs négatives.

Empiriquement, si les données que vous analysez ne sont pas distribuées comme la distribution que vous attendiez, ou si une autre source de valeurs aberrantes influe sur la valeur de la moyenne, alors les quantiles sont des statistiques bien plus utiles que la moyenne ou autres types de moments statistiques.

La régression robuste est fortement liée à ce sujet. Elle utilise la somme des valeurs absolues des valeurs observées, au lieu des erreurs au carré. La connexion se situe sur le fait que la moyenne est parmi les estimateurs liés à une distribution le seul qui minimise l'espérance du carré des erreurs, tandis que la médiane minimise l'espérance de l'erreur absolue. La régression robuste partage la capacité d'être relativement insensible aux larges déviations dues à certaines observations aberrantes.

Les quantiles d'une variable aléatoire sont préservés lors de transformations croissantes, ce qui signifie par exemple que si m est la médiane d'une variable aléatoire X alors 2m est la médiane de 2X, à moins qu'un choix arbitraire ait été fait à partir d'une plage de valeurs, pour spécifier un quantile particulier. Les quantiles peuvent aussi être utilisés dans les cas où seulement des données ordinales sont disponibles.

Calcul des quantiles

Il existe différentes méthodes pour estimer les quantiles :

Soit N le nombre de valeurs non manquantes de la population échantillonnée, et soit x_1,x_2,\ldots,x_N les valeurs ordonnées de la même population, telles que x1 est la plus petite valeur, etc. Pour la k-ième q-quantile, nous avons p = k / q.

Fonction de distribution empirique 
\begin{cases}x_j, & g=0\\ x_{j+1}, & g>0\end{cases}

j est la partie entière de Np et g la partie fractionnelle.

Fonction de distribution empirique avec mise à la moyenne 
\begin{cases}\frac{1}{2}(x_j+x_{j+1}), & g=0\\ x_{j+1}, & g>0\end{cases}

j est la partie entière de Np et g est la partie fractionnelle.

Moyenne pondérée 
xj + 1 + g(xj + 2xj + 1)

j est la partie entière de (N − 1)p et g est la partie fractionnelle. Cette méthode est utilisée, par exemple, dans la fonction PERCENTILE de Microsoft Excel.

Échantillon de numéro le plus proche de (N-1)p+1 
\begin{cases}x_j, & g\le 0,5\\ x_{j+1}, & g\ge 0,5\end{cases}

j est la partie entière de (N − 1)p + 1 et g est la partie fractionnelle.

Voir aussi


  • Portail des probabilités et des statistiques Portail des probabilités et des statistiques

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Quantile de Wikipédia en français (auteurs)

Игры ⚽ Поможем решить контрольную работу

Regardez d'autres dictionnaires:

  • quantile — [ k(w)ɑ̃til ] n. m. • mil. XXe; du lat. quantum ♦ Statist. Nombre qui divise la suite ordonnée des valeurs prises par un caractère quantitatif, en n parties d égale étendue. Si n est égal à 4, 10, 100..., les quantiles sont des quartiles, déciles …   Encyclopédie Universelle

  • quantile — [kwän′tīl΄, kwän′til] n. [< QUANT(ITY) + ILE] Statistics any of the values of a random variable dividing the distribution of the individuals into a given number of groups of equal frequency …   English World dictionary

  • Quantile — Quantiles are points taken at regular intervals from the cumulative distribution function of a random variable. Dividing ordered data into q essentially equal sized data subsets is the motivation for q quantiles; the quantiles are the data values …   Wikipedia

  • quantile — kvantilis statusas T sritis biomedicinos mokslai apibrėžtis ↑Kintamojo reikšmės, dalijančios didėjančia tvarka surašytą matavimo reikšmių seką į lygias dalis. Dažniausiai vartojami kvantiliai – ↑mediana (pusinė), ↑tercilis (tretinė), kvartilis… …   Lithuanian dictionary (lietuvių žodynas)

  • Quantile regression — is a type of regression analysis used in statistics. Whereas the method of least squares results in estimates that approximate the conditional mean of the response variable given certain values of the predictor variables, quantile regression… …   Wikipedia

  • Quantile d'ordre n — ● Quantile d ordre n chacune des n − 1 valeurs d un caractère quantitatif qui partagent l étendue des valeurs en n sous ensembles d effectifs égaux …   Encyclopédie Universelle

  • Quantile function — See also quantile. In probability theory, a quantile function of a probability distribution is the inverse F −1 of its cumulative distribution function (cdf) F . Assuming a continuous and strictly monotonic distribution function, scriptstyle… …   Wikipedia

  • Quantile-Quantile-Plot — Ein Quantile Quantile Plot (Q Q Plot, Quantil Quantil Diagramm) ist ein exploratives, grafisches Werkzeug, in dem die Quantile zweier statistischer Variablen gegeneinander abgetragen werden, um ihre Verteilungen zu vergleichen. Ein Probability… …   Deutsch Wikipedia

  • quantile — /kwon tuyl, til/, n. Statistics. one of the class of values of a variate that divides the total frequency of a sample or population into a given number of equal proportions. Cf. decile, percentile, quartile, quintile. [1935 40; QUANT(ITY) + ile n …   Universalium

  • quantile — noun /ˈkwɒn.taɪl/ One of the class of values of a variate which divides the members of and batch or sample into equal sized subgroups of adjacent values or a probability distribution into distributions of equal probability …   Wiktionary

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”