Chapitre 4 - Analyser un réseau Bayésien
La lisibilité des réseaux Bayésiens est une des caractéristiques qui est souvent mise en avant. Cette lisibilité doit toutefois être relativisée : elle est d’une part très dépendante du nombre de nœuds et d’arcs qui compose le réseau, et d’autre part, la présence d’un arc entre deux variables n’apporte aucune information autre que le fait qu’il soit fortement probable qu’une relation probabiliste existe entre les deux variables reliées.
Pour conserver et améliorer la lisibilité des réseaux Bayésiens, BayesiaLab est doté d’algorithmes de positionnement automatiques puissants et d’une boite à outils d’analyse complète.
4.1 Positionnement automatique
(Menu Affichage, sous-menu Positionnement automatique, item Positionnement dynamique).
(Menu Affichage, sous-menu Positionnement automatique, item Algorithme génétique).
Deux algorithmes sont proposés pour permettre d’augmenter la lisibilité liée aux positions des nœuds dans le graphe.
-
Un algorithme dynamique particulièrement adapté aux structures arborescentes ou faiblement connectées prenant en compte :
- les relations de parenté entre les noeuds (les parents tentent de se positionner au dessus de leurs enfants),
- les coupures d'arcs pour tenter de les éviter,
- la force des arcs (cf. 4.2),
- le poids des noeuds, défini en fonction du nombre d'enfants et de parents de chaque noeud.
-
Un algorithme génétique pour traiter les réseaux plus complexes. Cet algorithme peut prendre en compte (le poids de chaque facteur peut être modifié par l’intermédiaire des préférences) :
- les relations entre les noeuds (les parents se positionnent au dessus de leurs enfants),
- la verticalité des arcs,
- le recouvrement des noeuds
- l'intersection des arcs avec les autres arcs et les noeuds.
4.2 Analyse des arcs
(Mode Validation, menu Inférence, item Analyse des arcs).
Cet outil est un outil d’analyse globale dont le but est de mettre en évidence la force des arcs. L’épaisseur des arcs est calculée en fonction de l’importance de la relation probabiliste modélisée par l’arc dans la loi de probabilités jointe : plus la relation est importante, plus l’arc est épais. Ce type d’analyse se couple avec les algorithmes de positionnement automatique : plus la relation est importante, plus l’arc est court.
4.3 Analyse du nœud cible
(Mode Validation, menu Inférence, item Analyse du nœud cible).
Le deuxième outil d’analyse est plus local dans le sens où l’analyse se focalise sur une variable cible. L’analyse du nœud cible permet en effet la visualisation de la quantité d'information apportée par chaque noeud pour la connaissance du noeud cible. La clarté des carrés figurant à l'intérieur des noeuds est proportionnelle à cette quantité d'information.
4.4 Analyse des modalités du nœud cible
(Mode Validation, menu Inférence, item Analyse des modalités du nœud cible).
BayesiaLab dispose d’un troisième outil d’analyse encore plus local que l’analyse du nœud cible. L’analyse des modalités du noeud cible permet en effet de visualiser, pour chaque noeud, deux informations relatives à sa relation probabiliste avec la variable cible :
-
le type d'influence de la variable sur une modalité particulière de la variable cible avec le symbole figurant à l’intérieur du nœud,
-
le gain d'information apporté par le noeud sur la connaissance de la modalité cible, mis en évidence par la clarté du symbole.
Le symbole contenu à l’intérieur du nœud schématise l’évolution de la probabilité conditionnelle de la modalité cible en fonction des différentes modalités de ce nœud. L’évolution précise peut être visualisée, comme illustré sur la copie d’écran ci-dessus, par l’intermédiaire du menu contextuel du nœud « Analyse de l’influence sur la valeur cible ».
4.5 Rapport d’analyse de la cible
(Mode Validation, menu Inférence, item Rapport d’analyse de la cible).
Outre ces trois outils d’analyse, BayesiaLab offre également la possibilité d’éditer un rapport d'analyse du noeud cible. Ce rapport HTML permet notamment d’obtenir :
-
Une description de l'ensemble des variables observées au moment de l'analyse.
-
La distribution de probabilités de la variable cible sachant l'ensemble des variables observées (contexte).
-
La liste des nœuds ayant une dépendance probabiliste avec la variable cible, liste triée par ordre décroissant en fonction de leur apport d'information relatif.
-
Pour chacune des valeurs de la cible, la liste des nœuds ayant une dépendance probabiliste avec la variable cible, triée par ordre décroissant en fonction de leur apport d'information relatif sur la modalité cible
-
Un profil pour chacune des valeurs de la cible, exprimé par une description de la valeur modale de chaque variable dépendante. Ces profils sont comparés avec les valeurs modales des nœuds en l'absence de connaissance de la variable cible (profil a priori).
Le rapport d’analyse ci-dessous correspond au réseau Bayésien de notre spécialiste des maladies du poumon, rapport focalisé sur le Cancer et plus particulièrement sur les jeunes patients.
4.6 Rapport d’analyse des observations
(Mode Validation, menu Inférence, item Rapport d’analyse des observations).
BayesiaLab propose un second rapport dédié à l’analyse de l'ensemble des observations. Le but de cette analyse est de calculer si les observations sont contradictoires ou si au contraire elles abondent dans le même sens. Ce rapport, qui nécessite la spécification d’une observation racine pour indiquer la conclusion de référence, contient :
-
Le contexte de l'analyse
-
Une mesure de contradiction globale des observations
-
Une analyse des observations relativement à l'observation racine, avec l’ensemble des observations qui confirment l'observation racine, l’ensemble des observations qui contredisent l'observation racine et l’ensemble des observations neutres.
Le rapport ci-dessous correspond à une analyse des observations correspondant sur un patient souffrant de difficultés respiratoire (observation racine). Ce rapport indique une contradiction globale des observations, avec deux sous-ensembles : Fumeur et Difficulté respiratoire d’un coté, et absence de bronchite et radiographie normale de l’autre.
4.7 Analyse causale
(Mode Validation, menu Inférence, item Afficher les arêtes).
(Mode Validation, menu Inférence, item Orientation globale des arêtes).
Le dernier outil d’analyse est relatif à l’analyse causale. Il permet en effet de désorienter les arcs dont l’orientation peut être inversée sans pour autant changer la loi de probabilité jointe Par exemple, dans le cas d’une base décrivant si le patient fume et si il a le cancer, il est impossible de savoir uniquement par le biais des données si c’est le fait de fumer qui cause le cancer ou si c’est l’inverse. La seule certitude, c’est qu’il y a une relation entre ces deux variables. Hors, un réseau Bayésien étant un graphe orienté, le résultat des algorithmes d’apprentissage donne une orientation à toutes les relations. Certaines sont donc choisies aléatoirement. L’affichage des arêtes permet ainsi de mettre en évidence les arcs dont l’orientation n’a pas été le résultat d’un choix arbitraire (cf. 3.3).



