English Recherche

Chapitre 2 : Exploiter le réseau Bayésien

2.1    L’inférence et le monitoring

La modélisation étant terminée, il faut passer en mode validation pour exploiter le réseau. Pour ce faire, il existe trois moyens : la touche de fonction « F2 » (« F1 » permettant de revenir en mode Modélisation), en cliquant en bas à gauche de la feuille de travail sur l’icône Validation, ou encore par le biais du menu Affichage :


Image 1

Ce mode donne accès au monitoring pour visualiser les probabilités des différentes modalités d’une variable, attribuer une valeur certaine à une variable (observation), ou encore définir un degré de vraisemblance sur les valeurs des variables (observations modérée et négative). Au moindre changement dans l’ensemble des observations, les probabilités de chaque nœud sont mises à jour pour tenir compte du nouvel état de connaissance.

Le monitoring permet au spécialiste de vérifier la cohérence du réseau (choix des arcs, des noeuds et des probabilités conditionnelles) et de mesurer les interactions probabilistes entre les variables par le biais de scénarii Et Si (What if).

Monitoring

L’accès au moniteur d’une variable peut s’effectuer de deux manières : par un clic droit sur la variable à analyser (déclenche le menu contextuel associé au nœud), ou plus simplement par un double clic gauche sur le nœud.

Pour illustrer l’utilisation des moniteurs, supposons que le spécialiste veuille vérifier le « ou logique » TbOuCa. Il va effectuer un monitoring sur cette variable ainsi que ses nœuds pères (Tuberculose et Cancer). Voici une partie de la démarche pour vérifier un ‘ou’ logique :

Image 3

Les trois moniteurs des nœuds à vérifier

Apparaissent en gras les valeurs des probabilités non arrondies. L’appuie sur la touche « V » lors d’un pointage sur un moniteur permet d’afficher une fenêtre avec les valeurs exactes. Si on observe la modalité Oui de Cancer, alors la modalité Oui de TbOuCa passe à 100%. Réciproquement, l’observation de Tuberculose à Oui implique une probabilité de 100% pour la modalité Oui de TbOuCa. Pour cela, il suffit de double-cliquer sur les modalités correspondantes des moniteurs, ou d’effectuer un click droit pour déclencher le menu contextuel du moniteur, et de vérifier le résultat de cette action sur la variable TbOuCa :

Moniteur

Cela permet de vérifier, en partie, le bon fonctionnement du OU logique.

Il est également possible de mesurer l’impact de TbOuCa sur les variables Cancer et Tuberculose, en introduisant par exemple des observations modérées sur TbOuCa. L’introduction de ce type d’observation nécessite d’activer le mode d’édition des vraisemblances, soit par un click sur une modalité en pressant la touche <Maj.>, soit par l’intermédiaire du menu contextuel associé au moniteur. Une fois ce mode activé, les degrés de vraisemblance peuvent être saisis par le biais de la souris ou encore en éditant directement la valeur. La validation de la saisie s’effectue par l’intermédiaire du bouton vert. Les degrés de vraisemblance sont alors pris en compte pour calculer la une nouvelle distribution de probabilité sur la variable TbOuCa, qui elle-même influe les distributions de probabilités de  Tuberculose et Cancer.

Moniteur


2.2 Les questionnaires adaptatifs (centré sur la cible ou sur une modalité)
2.2.1 Questionnaire adaptatif centré sur la variable cible

Les questionnaires adaptatifs organisent automatiquement et dynamiquement (à chaque changement de l’ensemble des observations) les moniteurs en fonction de l'apport d'information pour la connaissance de la variable cible et du coût des questions correspondantes.

En mode Validation, le menu Inférence permet d’accéder à l’assistant des questionnaires adaptatifs.

Image 6


Cet assistant permet :

* de sélectionner la variable cible,
* de choisir le type de questionnaire (centré ou non sur une modalité cible (cf. paragraphe 2.2.2),
* de réinitialiser ou non de l’ensemble des observations avant l’élaboration initiale du questionnaire,
* de spécifier le nombre de questions à afficher (i.e. le nombre de moniteurs au fond blanc), et enfin
* de lancer  l’éditeur de coûts.

Le moniteur rose correspond à la variable cible puis apparaissent dans un ordre optimal (en fonction du coût et de l’apport d’information de chaque noeud) les moniteurs des variables permettant de la déterminer au mieux. Dans la première étape illustrée ci-dessous, la question apportant le plus d’information sur Cancer au moindre coût est la question « Difficulté Respiratoire ». Si cette question ne peut être posée, ou si on n’a pas de réponse, la deuxième  meilleure question porte sur l’age du patient. En l’absence de coût, il est bien évident qu’effectuer une radiographie directement apporterait le plus d’information sur la variable Cancer.

1.

Moniteur



2.

 

Moniteur

L’observation à Oui pour « Difficulté Respiratoire » (la réponse à cette question), entraîne la mise à jour des distributions de probabilités des autres variables et de la liste des questions. Les flèches sur les moniteurs permettent de visualiser les variations de probabilités produites par l’observation.

3.

Exemple de flèches


4.

Exemple de flèches


Le patient étant un fumeur, la nouvelle meilleure investigation consiste à savoir si le patient souffre d’une bronchite ou non (et non plus faire une radio comme initialement prévu après la question Fumeur).     

5.

Moniteur



2.2.2    Questionnaire adaptatif centré sur une modalité particulière de la variable cible

Ce questionnaire est similaire au précédent mais l'intérêt des questions est mesuré non plus sur la connaissance globale de la variable cible mais sur la connaissance d'une valeur particulière de cette variable. Dans le cas où la cible est une variable n’ayant que deux modalités, ces deux questionnaires sont équivalents.


2.3 Exploitation hors ligne des modèles

Hormis les questionnaires adaptatifs qui permettent d’exploiter de manière interactive les modèles Bayésiens, BayesiaLab  dispose d’un outil d’exploitation Batch (menu Inférence – Exploitation Hors-ligne). Cette option prend en entrée une base de données et permet d’utiliser le réseau Bayésien pour inférer, pour chacune des lignes de la base à traiter, la valeur la plus probable de la variable cible en fonction de l’ensemble des valeurs des autres variables sur cette ligne. Un assistant permet de définir quels champs seront repris dans le fichier résultat, certains champs pouvant ne pas être pris en compte dans le réseau et être cependant nécessaires dans le fichier de sortie (par exemple les identificateurs).

Assistant


Deux autres champs sont ajoutés automatiquement : la valeur du nœud cible prédite ($) et la probabilité sur laquelle repose le choix de cette valeur ($$).


Age $Cancer  $$Cancer
1
89.05831
Non
 0.9998265758014836
 2  54.47454
 Non
 0.9999700205169252
 3   ?  Non
 0.9997925521626105
 4  93.48285  Non
 0.9998265758014836
 5  42.232517  Non
 0.9999147468451574
 6  45.99444  Non
 0.9998176641092605
 7  80.94802  Non
 0.9998265758014836
 8  30.676228  Non
 0.9999932134767724
 9   65.22123  Non
 0.9998265758014836
 10  68.29758  Non
 0.9998265758014836
 11  47.897926  Non
 0.9999700205169252
 12  49.40997  Non
 0.9999700205169252
 13  95.25699  Non
 0.9992836641506526
 14  35.907204  Non
 0.999996156376072

2.4  Améliorer le réseau

Notre spécialiste a un réseau Bayésien qu’il peut exploiter grâce aux outils de BayesiaLab . S’il le désire, il peut affiner son réseau par apprentissage sur de nouvelles données (cf. chapitre 3 pour l’association d’une base de données, Associer une source de données) correspondant à de nouveaux patients traités. Ainsi, le réseau Bayésien est en constante évolution.