Covariance

Covariance
Page d'aide sur les redirections Pour le principe physique, voir Principe de covariance générale.
Page d'aide sur l'homonymie Ne pas confondre avec la covariance d'un tenseur en algèbre ou en géométrie différentielle, ou d'un foncteur en théorie des catégories.

En théorie des probabilités et en statistique, la covariance est un nombre permettant d'évaluer le sens de variation de deux variables et, ainsi, de qualifier l'indépendance de ces variables.

Si deux variables sont indépendantes alors leur covariance est nulle, mais la réciproque est fausse.

Sommaire

Définition

On nomme covariance de deux variables aléatoires réelles X et Y, et on note cov(X,Y) (ou parfois σXY) la valeur :

Définition — \operatorname{cov}(X,Y)\equiv E[(X-E[X])\,(Y-E[Y])]

où E désigne l'espérance mathématique.

La variance de X est donc cov(X,X).

Intuitivement, la covariance est une mesure de la variation simultanée de deux variables aléatoires. C'est-à-dire que la covariance devient plus positive pour chaque couple de valeurs qui diffèrent de leur moyenne dans le même sens, et plus négative pour chaque couple de valeurs qui diffèrent de leur moyenne dans le sens opposé.

L'unité de mesure de la covariance cov(X,Y) est le produit de l'unité des variables aléatoires X et Y et sa valeur est comprise dans ]-\infty; +\infty[. En revanche, la corrélation, qui dépend de la covariance, est une mesure de dépendance linéaire sans unité et prend ses valeurs dans [ − 1;1].

Dans le cas de variables discrètes, on a:

\sigma_{xy}=\operatorname{cov}(x, y) = \sum_{i=1}^n \sum_{j=1}^m(x_i y_j p(x_i) p(y_j/x=x_i))-\bar{x}\bar{y}=\sum_{i=1}^n \sum_{j=1}^m(x_i y_j p(y_j) p(x_i/y=y_j))-\bar{x}\bar{y}
tandis que: \sigma_x^2 = \sum_{i=1}^n x_i^2 p(x_i)-\bar{x}^2 et \sigma_y^2 = \sum_{j=1}^m y_j^2 p(y_j)-\bar{y}^2

Propriétés

Par généralisation du théorème de König-Huyghens pour la variance, on a :

Propriété — \operatorname{cov}(X, Y) = E(X Y) - E(X)E(Y)

Corollaire — Si X et Y sont indépendantes alors \operatorname{cov}(X,Y) =0.

La réciproque, cependant, n'est pas vraie. Il est en effet possible que X et Y ne soient pas indépendantes, et que leur covariance soit nulle. Des variables aléatoires dont la covariance est nulle sont dites non corrélées.

Propriétés — 

  • \operatorname{cov}(X, X) = \operatorname{var}(X)
  • \operatorname{cov}(X, Y) = \operatorname{cov}(Y, X)
  • \operatorname{cov}(cX, Y) = c\, \operatorname{cov}(X, Y) si c est une constante
  • \operatorname{cov}(X+c, Y) = \operatorname{cov}(X, Y) si c est une constante

Bilinéarité de la covariance :

Propriété —  \operatorname{cov}\left(\sum_i{X_i}, \sum_j{Y_j}\right) = \sum_i{\sum_j{\operatorname{cov}\left(X_i, Y_j\right)}}

Ceci traduit le fait que la covariance est une forme bilinéaire symétrique positive (sur l'espace vectoriel L^2(\Omega, \mathcal{B}, \mathbb{P}) des variables aléatoires de carré intégrable), et que la forme quadratique associée est la variance.

Corollaire —  \operatorname{var}(X+Y) = \operatorname{var}(X) + \operatorname{var}(Y) + 2 \operatorname{cov}(X,Y)

Cette formule est l'analogue de (x + y)2 = x2 + y2 + 2xy . En fait, la plupart des propriétés de la covariance sont analogues à celles du produit de deux réels ou du produit scalaire de deux vecteurs.

Propriété —  \operatorname{var}\left(\sum_{i=1}^n{X_i}\right) = \sum_{i=1}^n\operatorname{var}(X_i) + 2\sum_{1\le i<j\le n}\operatorname{cov}(X_i,X_j)

Cette formule est classique pour une forme quadratique associée à une forme bilinéaire symétrique.

Exemple

Dans un forum Internet, quelqu'un affirme que l'activité du forum est plus intense les jours de pleine lune. On peut ne pas disposer du calendrier des pleines lunes, mais si cette affirmation est exacte et si l'on nomme N(t) le nombre de contributions au jour t, la covariance entre N(t) et N(t+28) cumulée sur toutes les valeurs de t, sera probablement supérieure aux covariances entre N(t) et N(t+x) pour les valeurs de x différentes de 28.

Estimation

Un estimateur de la covariance \operatorname{cov}(AB)\equiv\sigma_{AB} de deux variables aléatoires A et B observées conjointement N fois est donné par:

\hat\sigma_{AB} = \frac{\sum a_i \cdot b_i}{N} - \frac{\sum a_i}{N} \cdot \frac{\sum b_i}{N}


Matrice de variance-covariance

Article détaillé : Matrice de variance-covariance.

Définition

La matrice de variance-covariance (ou simplement matrice de variance) d'un vecteur de k variables aléatoires \vec X est la matrice carrée donnée par :

\operatorname{var}(\vec X)
=
\operatorname{var}\begin{pmatrix} X_1  \\ \vdots\\ X_k \end{pmatrix}
=
\begin{pmatrix} 
\operatorname{var}(X_1) & \operatorname{cov}(X_{1}X_{2}) &  \cdots & \operatorname{cov}(X_{1}X_{k}) \\
\operatorname{cov}(X_{1}X_{2}) & \ddots & \cdots & \vdots\\
\vdots & \vdots & \ddots & \vdots\\
\operatorname{cov}(X_{1}X_{k}) & \cdots & \cdots&  \operatorname{var}(X_k) 
\end{pmatrix}
=
\begin{pmatrix} 
\sigma^2_{x_1} & \sigma_{x_{1}x_{2}} &  \cdots & \sigma_{x_{1}x_{k}} \\
\sigma_{x_{1}x_{2}} & \ddots & \cdots & \vdots\\
\vdots & \vdots & \ddots & \vdots\\
\sigma_{x_{1}x_{k}} & \cdots & \cdots&  \sigma^2_{x_k} 
\end{pmatrix}


Vue la propriété \operatorname{cov}(X, Y) = \operatorname{cov}(Y, X), il s'agit d'une matrice symétrique. L'inverse de la matrice de covariance est parfois désignée par le terme de « matrice de précision ». La matrice de covariance est un cas particulier de matrice de Gram.

Estimation

Un estimateur de la matrice de variance-covariance de N réalisations d'un vecteur de variables aléatoires peut être donné par:

\operatorname{\widehat {var}}(\vec X) = \frac{\sum x_i \cdot x_i^T}{N} - \frac{\sum x_i}{N} \cdot \left(\frac{\sum x_i}{N}\right)^T

Usage

La connaissance des covariances est le plus souvent indispensable dans les fonctions d'estimation, de filtrage et de lissage. Elles permettent, entre autres en photographie, d'arriver à corriger de façon spectaculaire les flous de mise au point ainsi que les flous de bougé, ce qui est extrêmement important pour les clichés astronomiques. On les utilise également en automatique. En sociolinguistique, la covariance désigne la correspondance entre l’appartenance à une certaine classe sociale et un certain parler inhérent à cette condition sociale. Les matrices de covariances sont utilisées pour le krigeage et les méthodes d'analyse par EOF.

Voir aussi

Sur les autres projets Wikimedia :


  • Portail des probabilités et des statistiques Portail des probabilités et des statistiques

Wikimedia Foundation. 2010.

Contenu soumis à la licence CC-BY-SA. Source : Article Covariance de Wikipédia en français (auteurs)

Игры ⚽ Нужно сделать НИР?

Regardez d'autres dictionnaires:

  • covariance — [ kovarjɑ̃s ] n. f. • 1921; de co et variance ♦ Math. Covariance de deux variables aléatoires : moyenne des produits de deux variables centrées sur leurs espérances mathématiques et servant à définir leur coefficient de corrélation. ● covariance… …   Encyclopédie Universelle

  • covariance — n. a statistical measure of the relationship of two variables, formed by multiplying the difference of each variable from its mean, both variables being measured at the same time, and averaging all such products. [WordNet 1.5 +PJC] …   The Collaborative International Dictionary of English

  • covariance — 1878, from covariant (1853), from CO (Cf. co ) + VARIANT (Cf. variant) …   Etymology dictionary

  • covariance — [kō′ver΄ē əns, kō′ver′ē əns] n. Statistics a measure of the relationship between two variables whose values are observed at the same time; specif., the average value of the product of the two variables diminished by the product of their average… …   English World dictionary

  • Covariance — This article is about the measure of linear relation between random variables. For other uses, see Covariance (disambiguation). In probability theory and statistics, covariance is a measure of how much two variables change together. Variance is a …   Wikipedia

  • Covariance — A measure of the degree to which returns on two risky assets move in tandem. A positive covariance means that asset returns move together. A negative covariance means returns move inversely. One method of calculating covariance is by looking at… …   Investment dictionary

  • covariance — A measurement of the relationship between two variables. The arithmetic mean of the products of the deviations of corresponding values of two quantitative variables from their respective means. American Banker Glossary A statistical measure of… …   Financial and business terms

  • covariance — kovariacija statusas T sritis Standartizacija ir metrologija apibrėžtis Dviejų atsitiktinių kintamųjų dydžių tarpusavio priklausomybės matas, lygus jų verčių sandaugos statistiniam vidurkiui. atitikmenys: angl. covariance vok. Kovarianz, f rus.… …   Penkiakalbis aiškinamasis metrologijos terminų žodynas

  • covariance — kovariantiškumas statusas T sritis fizika atitikmenys: angl. covariance vok. Kovarianz, f rus. ковариантность, f pranc. covariance, f …   Fizikos terminų žodynas

  • Covariance — A statistical measure of the degree to which random variables move together. The New York Times Financial Glossary * * *    A statistical term for the correlation of two variables multiplied by the individual standard deviation for each of the… …   Financial and business terms

Share the article and excerpts

Direct link
Do a right-click on the link above
and select “Copy Link”