Chapitre 1 - Créer un réseau bayésien (mode modélisation)
L’interface graphique de BayesiaLab permet une élaboration manuelle intuitive d’un réseau bayésien. Pour avoir accès à cette fonctionnalité, il faut soit créer un nouveau graphe soit éditer un graphe existant.
Lorsqu’une feuille de travail est ouverte, de nouveaux icônes apparaissent dans la barre de tâche :

- Créer un nouveau graphe
- Ouvrir un graphe (format « xbl », « bif » ou « net »)
- Sauvegarder un graphe
- Imprimer un graphe

- Couper
- Copier
- Coller
- Annuler la dernière action
- Refaire la dernière action
- Rechercher un nœud

- Zoom avant
- Zoom arrière
- Affichage par défaut
- Ajuster au mieux dans la page
- Sélectionner un nœud ou un arc
- Créer un nœud
- Créer un nœud contrainte
- Créer un nœud utilité
- Créer un nœud décision
- Créer un arc
- Supprimer un arc ou un nœud
1.1 Création des nœuds et des arcs
Considérons le cas d’un spécialiste des maladies des poumons désirant modéliser sa connaissance (très simplifiée) sur le diagnostic du cancer ou de la tuberculose.
L’élaboration d’un réseau bayésien passe par le recensement préalable des différentes variables nécessaires à la description du domaine considéré. A chacune de ces variables correspond alors un nœud dans le graphe.
Grâce au bouton « créer un nœud » (ou encore en maintenant enfoncé la touche « N » pendant le clic gauche), notre spécialiste commence par placer sur sa feuille de travail trois nœuds représentant l’âge du patient, le fait de savoir si le patient fume, et le cancer.
Un symbole d’avertissement s’affiche en haut à gauche des nœuds pour signifier que les probabilités associées n’ont pas été vérifiée ou sont incorrectes. Pour visualiser le message d’avertissement il suffit de passer le pointeur de la souris sur le nœud concerné en maintenant la touche W enfoncée.
Il définit ensuite les relations probabilistes entre ces trois variables. Ces relations sont matérialisées par des arcs qu’il est possible de créer grâce au bouton « créer un arc », en faisant glisser la souris, bouton gauche enfoncé, d’un nœud à l’autre (il est également possible de passer en mode création d’arc en maintenant la touche « L » enfoncée préalablement au « tirage » de l’arc).
- L’âge a une influence directe sur le fait de fumer et sur le cancer
- Fumer a une influence directe sur le cancer
La copie d’écran présentée ci-dessous correspond au menu contextuel associé aux nœuds en mode Modélisation (les items grisés ne sont disponibles qu’en mode Validation, c'est-à-dire qu’ils sont associés à l’inférence). Alors que la première fonction permet d’éditer les propriétés de chaque nœud (cf. chapitre 1.2), la définition d’un nœud cible est utile notamment dans le cas de l’élaboration automatique d’un réseau bayésien à partir d’une base de données (cf. chapitre 3). L’item « Marquer le nœud » de ce menu permet de marquer les nœuds avec des couleurs spécifiques (pour repérer par exemple rapidement les nœuds symptômes, les nœuds maladies …)
Notre spécialiste ajoute alors la variable tuberculose, et une autre variable TbOuCa pour effectuer un « ou logique » entre la tuberculose et le cancer. Ce noeud n’est pas indispensable mais il permettra de simplifier le graphe par la suite en raison des symptômes communs à ces deux maladies.
La définition de ce « ou logique » requiert la spécification de relations directes entre les nœuds Tuberculose et Cancer et ce nœud logique TbOuCa.
La touche « P » permet ensuite de positionner automatiquement les nœuds tel qu’ils sont sur la copie d’écran ci-dessous (les parents au dessus des enfants).
Le menu contextuel décrit ci-dessous est celui associé aux arcs. Il est alors possible de changer l’orientation d’un arc, de le supprimer, de le fixer ou de le définir comme arc temporel (cf. chapitre 4). Fixer un arc est un moyen d’introduction de connaissance experte dans le processus d’apprentissage automatique en signifiant à l’algorithme que cette connaissance est certaine (cf. chapitre 3).
À la fin le spécialiste a développé un réseau correspondant à sa connaissance des maladies respiratoires :
Il est possible d’associer un commentaire global au réseau ainsi qu’un commentaire pour chaque nœud grâce aux menus contextuels. Ces commentaires peuvent contenir des liens vers des fichiers quelconques et des adresses Internet. Les nœuds possédant un commentaire affichent une bulle après leur nom. Pour visualiser ces commentaires, il suffit de passer le pointeur de la souris sur les nœuds concernés en maintenant la touche V enfoncée :
1.2 Présentation de l’interface d’édition d’un nœud
Une fois la partie structurelle du graphe créée (nœuds et arcs), il reste à remplir la table de probabilités conditionnelles de chaque nœud (double clic gauche sur le nœud ou par l’intermédiaire du menu contextuel associé au nœud, « éditer le nœud »).
En haut à gauche est affiché le nom de la variable. Figure ensuite le type de la variable (Label ou Intervalle), suivi de l’ensemble de ses modalités (liste des différentes valeurs que peut prendre le nœud de façon exclusive).
Si le type est Label (c’est-à-dire symbolique), l’utilisateur peut modifier la liste des valeurs par défaut selon ses besoins. La liste des valeurs par défaut d’une variable symbolique est (Faux, Vrai).
Si le type est Intervalle (c'est-à-dire que la variable représentée est initialement continue), l’utilisateur spécifie l’intervalle de valeurs continues associées à chaque modalité, soit par l’intermédiaire de la table, soit directement sur l’axe représentant le domaine de variation de la variable continue. On peut également générer automatiquement le nombre d’intervalles désiré avec le bouton correspondant.
Le mode de saisie par défaut des paramètres associés au nœud est la table de probabilités. Si la table de probabilités conditionnelles est remplie de manière partielle ou avec des valeurs numériques non normalisées, il est possible d’utiliser les boutons « Compléter », « Normaliser » ou « Aléatoire » pour ramener la somme d’une ligne à 100.
Les deux tables de probabilités ci-dessous quantifient les relations probabilistes directes entre l’âge, fumer et le cancer.
Plus le patient est jeune, plus la probabilité qu’il fume est élevée
Plus le patient est âgé, plus la probabilité qu’il ait le cancer est élevé, le fait de fumer étant un facteur aggravant.
Enfin, la variable « TbOuCa » représente un « ou logique » et est donc un nœud déterministe. Sa table de probabilités est donc la suivante :
Toutefois, ce type de saisie peut s’avérer lourd dans le cas des variables déterministes. Le mode de saisie Déterministe permet une saisie de la relation plus « économe » en ne spécifiant plus des distributions de probabilités mais des modalités certaines (avec une probabilité de 100). Dans ce mode, le « ou logique » devient :
Enfin, on peut définir automatiquement des distributions de probabilités à l’aide d’équations déterministes ou probabilistes grâce au mode Equation. Un grand nombre de fonctions sont préprogrammées et peuvent être utilisées directement ou bien vous pouvez créer vos propres équations. Dans l’exemple, on utilisera simplement un « ou logique » représenté par « | » :
1.3 Gestion des coûts
Il est possible d’associer un coût à un nœud, ou plutôt à la connaissance de la valeur de ce nœud. Il ne s’agit pas forcément d’un coût financier. Il peut être assimilé à une gêne (un médecin posant une question indiscrète ou un examen douloureux) ou un risque (l’investigation nécessite un examen à risque). BayesiaLab propose de remplir une table des coûts afin de gérer un questionnaire adaptatif.
En mode Modélisation, l’accès à la table des coûts, s’effectue par l’intermédiaire du menu contextuel associé à le fenêtre du réseau (un clic droit sur la feuille de travail) et de sélectionner « Editer les coûts ». En mode Validation, ces coûts sont également éditables à partir de l’assistant des questionnaires adaptatifs.
Dans le cas de notre spécialiste, Tuberculose, TbOuCa et Cancer sont les variables correspondant au diagnostic, leur valeur sont donc considérées comme non observables, état obtenu en supprimant la valeur contenue dans la cellule (le médecin ne peut pas demander au patient si il a le cancer). Le coût de la radiographie est également nettement plus important que la question sur l’âge ou sur le fait de fumer, d’où un coût de 1000, contre 10 et 5 respectivement. Les coûts sont exploités lors de l’élaboration automatique d’un questionnaire adaptatif.






