- Réseau bayesien
-
Réseau bayésien
Les Réseaux bayésiens sont à la fois :
- Des modèles de représentation des connaissances
- Des "machines à calculer" les probabilités conditionnelles
Pour un domaine donné (par exemple médical), on décrit les relations causales entre variables d'intérêt par un graphe.
Dans ce graphe, les relations de cause à effet entre les variables ne sont pas déterministes, mais probabilisées. Ainsi, l'observation d'une cause ou de plusieurs causes n'entraîne pas systématiquement l'effet ou les effets qui en dépendent, mais modifie seulement la probabilité de les observer.
L'intérêt particulier des réseaux bayésiens est de tenir compte simultanément de connaissances a priori d'experts (dans le graphe) et de l'expérience contenue dans les données.
Les réseaux bayésiens sont surtout utilisés pour le diagnostic (médical et industriel), l'analyse de risques, la détection des spams et le data mining.
Sommaire
Un exemple très simple dans la modélisation des risques
Un opérateur travaillant sur une machine risque de se blesser s’il l’utilise mal. Ce risque dépend de l’expérience de l’opérateur et de la complexité de la machine. « Expérience » et « Complexité » sont deux facteurs déterminants de ce risque (fig. 1)
Bien sûr, ces facteurs ne permettent pas de créer un modèle déterministe. Si l’opérateur est expérimenté et la machine simple, cela ne garantit pas qu’il n’y aura pas d’accident. D’autres facteurs peuvent jouer : l’opérateur peut être fatigué, dérangé, etc. La survenance du risque est toujours aléatoire, mais la probabilité de survenance dépend des facteurs identifiés.
La figure Fig.1 ci-dessous représente la structure de causalité de ce modèle (graphe).
(saisir schéma Fig.1 ici)
La figure Fig.2 représente la probabilisation de la dépendance : on voit que la probabilité d'accident augmente si l'utilisateur est peu expérimenté ou la machine complexe.
(saisir schéma Fig.2 ici)
On voit ici comment intégrer des connaissances d'expert (les facteurs déterminants) et des données (par exemple, la table de probabilité d'accident en fonction des déterminants peut venir de statistiques).
Construction de réseaux bayésiens
Construire un réseau bayésien c'est donc :
- Définir le graphe du modèle
- Définir les tables de probabilité de chaque variable, conditionnellement à ses causes.
Le graphe est aussi appelé la "structure" du modèle, et les tables de probabilités ses "paramètres". Structure et paramètres peuvent être fournis par des experts, ou calculés à partir de données, même si en général, la structure est définie par des experts et les paramètres calculés à partir de données expérimentales.
Utilisation d'un réseau bayésien
L'utilisation d'un réseau bayésien s'appelle "inférence". Le réseau bayésien est alors véritablement une "machine à calculer des probabilités conditionnelles". En fonction des informations observées, on calcule la probabilité des données non observées. Par exemple, en fonction des symptômes d'un malade, on calcule les probabilités des différentes pathologies compatibles avec ces symptômes. On peut aussi calculer la probabilité de symptômes non observés, et en déduire les examens complémentaires les plus intéressants.
Liens & Outils logiciels
- Bayesia : http://www.bayesia.fr
- Hugin : http://www.hugin.com
- ProBayes : http://probayes.com
- Netica : http://www.norsys.com
- Elvira: http://leo.ugr.es/~elvira
- Bayes Net Toolbox: http://bnt.sourceforge.net/
- Structure Learning Package: http://bnt.insa-rouen.fr/
- Visual Numerics (IMSL)
- (en) Bayesian-Programming.org: Les probabilités comme alternative à la logique pour la perception, l'inférence, l'apprentissage et l'action]
Lecture
Les réseaux bayésiens, P. Naïm, P. Wuillemin, P. Leray, O. Pourret, A. Becker, Eyrolles 2004
Voir aussi
- Portail des probabilités et des statistiques
- Portail de l’informatique
Catégories : Apprentissage automatique | Systémique | Probabilités
Wikimedia Foundation. 2010.