- Auto-régression simultanée
-
Le Modèle d’Auto-régression simultanée (« Simultaneous AutoRegressive Model » ou « SAR ») est une généralisation du modèle de régression linéaire défini pour tenir compte de l'autocorrelation spatiale dans les problèmes de classification et de régression spatiale[1],[2]. Alors que dans la régression classique il est présupposé que le phénomène est stationnaire dans l'espace étudié, dès que l'analyste géographe détecte une dépendance entre l'observation effectuée et le lieu géographique, il doit employer un modèle non stationnaire tels que SAR, CAR ou GWR.
Sommaire
Description
Ce modèle prend la forme suivante :
où ρ et λ sont des coefficients d’auto-régression, W1 et W2 sont les matrices de poids spatiaux, x les variables explicatives, y la variable expliquée,ε et u représentent les erreurs[1].
Selon que les paramètres ρ et λ sont nuls ou non le modèle peut prendre les quatre formes suivantes[1] :
le modèle de régression linéairele modèle de décalage spatiale (« spatial lag model »), où la dépendance spatiale est portée par la variable réponse et apparait dans le modèle comme une variable explicative supplémentaire
le modèle d' erreur spatiale (« spatial error model »), où la dépendance spatiale est portée par la perturbation
et le modèle général, rarement utilisé[1]
Utilisation
On l'utilise ces modèles dans la fouille de données spatiales. Le modèle de décalage spatial est utilisé lorsque l'analyste suppose que le phénomène à analyser est influencé directement par le voisinage immédiat. L'analyste utilise le modèle d'erreur spatiale lorsque la dépendance est présente et identifié dans les résidus[1].
L'estimation des coefficients du modèle est en général effectuée à l'aide de la méthode du maximum de vraisemblance[3], bien que extrêmement consommatrice de ressource machine[4].
Notes et références
Notes
Références
- (en)Krista Collins, Colin Babyak, Joanne Moloney, « « Treatment of Spatial Autocorrelation in Geocoded Crime Data » ». Consulté le 15 octobre 2011 [PDF]
- (en)Baris M. Kazar, Shashi Shekhar, David J. Lilja, Ranga R. Vatsavai, R. Kelley Pace, « « Comparing Exact and Approximate Spatial AutoRegression Model Solutions for Spatial Data Analysis » ». Consulté le 20 septembre 2011 [PDF]
- « Lecture 1: Maximum likelihood estimation of spatial regression models » », 2008. Consulté le 30 octobre 2011 James P. LeSage, «
- « Parameter Estimation for the Spatial Autoregression Model: A Rigorous Approach » ». Consulté le 30 octobre 2011 Mete Celik, Baris M. Kazar, Shashi Shekhar, Daniel Boley, «
Voir aussi
Bibliographie
- (en)Harvey Miller et Jiawei Han, Geographic Data Mining and Knowledge Discovery, Boca Raton, CRC Press, 2009, 458 p. (ISBN 978-1-4200-7397-3).
- (en)Yee Leung, Knowledge Discovery in Spatial Data, Heidelberg, Springer, 2010, 360 p. (ISBN 978-3-6420-2664-5)
- (en)Hillol Kargupta, Jiawei Han, Philip Yu, Rajeev Motwani et Vipin Kumar, Next Generation of Data Mining, Minneapolis, CRC Press, 2009, 605 p. (ISBN 978-1-4200-8586-0)
- Franck Guarnieri et Emmanuel Garbolino, Systèmes d'information et risques naturels, Paris, Presses des MINES, 2003, 251 p. (ISBN 978-2911762529)
Articles connexes
- Régression linéaire
- Régression linéaire multiple
- Régression logistique
- Modèle linéaire généralisé
- Régression non paramétrique
- Modèles de régression multiple postulés et non postulés
- Régression géographiquement pondérée
- Auto-régression conditionnelle
- Champ aléatoire de Markov
Liens externes
- Hans-Peter Kriegel, Spatial Data Mining
- Portail des probabilités et des statistiques
- Portail de la géographie
Catégories :- Ingénierie décisionnelle
- Exploration de données
- Analyse spatiale
- Estimation (statistique)
Wikimedia Foundation. 2010.