- Regression (statistiques)
-
Régression (statistiques)
Pour les articles homonymes, voir Régression.La régression est une méthode statistique très utilisée pour analyser la relation d'une variable par rapport à une ou plusieurs autres. On recourt à une estimation des paramètres inconnus du modèles de régression par un ajustement mathématique du modèle spécifié en fonction des données récoltées. En économétrie, elle est notamment utilisée à des fins de prévision économique. À partir d'un ensemble de valeurs expérimentales, qui peuvent être représentées par des points sur un graphique, on cherche à calculer la courbe qui reproduit le mieux les variations de la grandeur à étudier, c'est-à-dire celle qui s'ajuste "au mieux" au nuage de points. La régression est donc l'opération qui consiste à ajuster une droite (ou une autre courbe mathématique) "le plus près possible" d'un certain nombre de points observés.
Une des méthodes les plus employées pour obtenir un modèle estimé est celle des « moindres carrés ». Sous certaines hypothèses, les estimateurs obtenus par la méthode des moindres carrés sont les meilleurs estimateurs pouvant être obtenus parmi ceux linéaires et non biaisés. Disposant de l'estimation de cette courbe, on peut alors effectuer des interpolations, pour calculer l'ordonnée de points intermédiaires. D'autres méthodes ont été plus récemment développées pour éviter des problèmes causés par des données atypiques ou sortant du cadre des hypothèses classiques, voir robustesse.
Les étapes généralement suivies pour obtenir une régression sont:
- Cadrage du problème,
- Sélection des variables pertinentes,
- Récolte des données,
- Spécification du modèle,
- Sélection de la méthode d'ajustement,
- Ajustement du modèle aux données,
- Validation du modèle estimé,
- Utilisation du modèle.
Le processus de construction du modèle de régression est souvent itératif, car lors de la validation ou de l'utilisation du modèle il n'est pas rare de devoir revenir sur les étapes précédentes selon les résultats obtenus.
Les tableurs permettent, pour affiner les corrélations, d'utiliser un modèle linéaire — une droite d'équation Y = a * X + b — mais aussi des modèles logarithmiques ou exponentiels. Le modèle exponentiel est utilisé pour illustrer des phénomènes dont les variations sont très rapides : l'accroissement de la variable est ici proportionnel à sa valeur.
Voir aussi
- Régression linéaire
- Régression linéaire multiple
- Régression logistique
- Modèles de régression multiple postulés et non postulés
- Portail de l’économie
- Portail des probabilités et des statistiques
Catégorie : Estimation (statistique)
Wikimedia Foundation. 2010.