BayesiaLab 4.1 : les nouveautés
- Données
- Graphiques
- Éditeur de noeud
- Réseau
- Interface
- Nouvelles icônes
- Nouvel outil de recherche
- Nouvel outil de sélection de noeuds
- Nouvel outil d'alignement de noeuds
- Noeuds non observables affichés différemment
- Image sur les noeuds
- Prévisualisation des images
- Commentaires de noeud et d'arc
- Édition des propriétés depuis le menu du noeud
- Réorganisation du menu Inférence
- Sécurité
- Moniteurs
- Apprentissage
- Inférence
- Préférences
Données
Discrétisation par arbre de décision
Les variables cibles utilisées pour la discrétisation par arbre de décision comprennent désormais les variables continues dont la discrétisation a déjà été spécifiée.
Rapport d'importation et d'association
Un rapport décrivant les traitements effectués lors de l'importation et de l'association d'une base de données est généré.
Encodage des fichiers de données
Il est possible de choisir l'encodage de manière à pouvoir importer des fichiers avec un encodage différent de celui par défaut de la plate-forme (Shift_JIS, UTF-8, UTF-16, UTF-16BE, UTF-16LE, iso, ibm, windows et beaucoup d'autres sont supportés). Les BOM (Byte Order Masks) sont supportés pour les encodage UTF-8 et UTF-16 (BE et LE).

Encodage des fichiers de sortie
Les préférences permettent de choisir l'encodage des fichiers de sorties tels que les sauvegardes ou les générations de bases de données et également les fichiers html générés (rapports et autres). Ce format d'encodage peut être modifié dans la fenêtre des préférences grâce à la boîte de choix "Encodage des fichiers" dans l'option "Base de données>Format de sauvegarde". Un indicateur d'encodage est également ajouté dans la partie meta des fichiers html.

Chemin des fichiers de données
Le chemin des fichiers de données importées ou associées est maintenant conservé afin de pouvoir être réutilisé rapidement dans le menu des bases de données récentes.
Dictionnaires
Les dictionnaires de coûts, de classes et de valeurs de modalité ont été ajoutés.
- un coût d'observation de la valeur du noeud peut être associé à chaque noeud en associant un nombre au nom du noeud (ou rien si le noeud doit être non observable)
- une ou plusieurs classes peuvent être associées à un ou plusieurs noeuds
- des valeurs numériques peuvent être associées aux modalités des noeuds en associant un nombre au nom d'un noeud suivi d'un point et du nom de la modalité voulue.
Les dictionnaires peuvent également être exportés.
Gestion des espaces dans les dictionnaires
Si le nom d'un noeud ou d'une modalité contient un espace, il doit être remplacé par un caractère souligné dans le fichier du dictionnaire. Par exemple, si vous désirer associé un coût (10) à un noeud appelé "Noeud 1", le fichier dictionnaire doit contenir la ligne :
Noeud_1 10
Images
Toutes les images associées au réseau comme l'image de fond et les images des noeuds sont inclues directement dans le fichier xbl du réseau.
Graphiques
Matrice d'occurrences
Les résultats peuvent être affichés selon quatre modes :
- Absolu,
- Pourcentage,
- Pourcentage en ligne,
- Pourcentage en colonne.
Éditeur de noeud
Nouvel éditeur de noeud
L'éditeur de noeud a été refait. Toutes les propriétés d'un noeud peuvent être éditées directement en sélectionnant l'onglet correspondant.

Classes
Un nouveau mécanisme permettant de créer des classes de noeuds a été ajouté. Une classe est un sous-ensemble de noeuds avec un nom donné. Un noeud peut appartenir à plusieurs classes en même temps. C'est très utile pour gérer des propriétés partagées par plusieurs noeuds (coûts, indices temporels, couleurs, images,...) et pour permettre de créer des contraintes d'arcs entre les noeuds.
Les classes sont gérées avec l'éditeur de noeuds :
Propriétés
Couleur, image, indice temporel et coût peuvent être édités dans ce panneau. Il est possible de propager les propriétés aux autres noeuds de même classe.

Valeurs
Il est désormais possible d'associer une valeur numérique aux modalités d'un noeud. Ces valeurs permettent de calculer une valeur numérique espérée pour ces noeuds, même si ces derniers sont purement symboliques. Les modalités sans valeur associée sont exclues du calcul de la valeur espérée.
Lorsqu'il existe au moins un noeud avec des valeurs associées, la valeur totale espérée du réseau et la valeur moyennée sur l'ensemble des noeuds ayant des valeurs associées sont affichées en dessous de la probabilité jointe.
Les valeurs jouent un rôle proche des noeuds Utilité. En effet, une valeur numérique espérée peut être obtenue en associant un noeud Utilité à chaque noeud, à l'exception des modalités sans valeur qu'il n'est pas possible de modéliser avec ce type de noeud. Ces valeurs servent donc à valuer le réseau, à mesurer l'impact de tel ou tel levier sur la qualité du réseau. Cependant, à la différence des noeuds Utilité, ces valeurs ne sont pas prises en compte pour l'apprentissage des politiques d'actions.
Ce sont par contre ces valeurs qui sont prises en compte pour le calcul du coefficient de corrélation linéaire R de Pearson.
Commentaire
Le commentaire peut être édité dans l'éditeur de noeuds.
Réseau
Arcs interdits
Un nouvel éditeur permet de créer et de gérer des contraintes sur les arcs. Les contraintes ainsi créées seront suivies par les algorithmes d'apprentissage.

Vous pouvez interdire l'ajout d'arc, dans une direction ou dans les deux, entre deux noeuds, entre un noeud et une classe de noeud, entre deux classes de noeuds ou entre une classe de noeud et un noeud.
Constantes
Un éditeur de constantes a été ajouté. Ces constantes seront utilisées dans les équations qui génèrent les tables de probabilités conditionnelles. Une constante possède un type (réel, entier, booléen ou chaîne) et une valeur. Les constantes sont gérées par cet éditeur :

Pour créer une nouvelle constante vous devez choisir un nom qui n'est pas déjà utilisé par un noeud ou une autre constante, un type et une valeur. Une fois la constante créée, sa valeur peut être modifiée et les tables de probabilités conditionnelles seront régénérées en accord avec les équations qui utilisent ces constantes modifiées.
Interface
Nouvelles icônes
Nouvel outil de recherche
L'outil de recherche des noeuds et des arcs prend en compte non seulement le nom des noeuds mais également les classes de noeuds définies.

Nouvel outil de sélection de noeuds
L'outil de sélection de noeuds disponible par l'intermédiaire du menu contextuel du noeud permet de sélectionner les noeuds appartenant à la même classe.

Nouvel outil d'alignement de noeuds
L'outil d'alignement de noeuds disponible par l'intermédiaire du menu contextuel du noeud permet de répartir les noeuds sélectionnés de manière régulière, horizontalement et verticalement.

Noeuds non observables affichés différemment
Les noeuds non observables et leurs moniteurs sont affichés en mauve afin d'être identifiés immédiatement.

Image sur les noeuds
Il est maintenant possible d'afficher une image à la place de la représentation par défaut du noeud.

L'image choisie peut être propagée aux noeuds des mêmes classes si nécessaire. Les images sont sauvegardées dans le fichier xbl du réseau.
On peut basculer de l'affichage standard à l'affichage avec les images (s'il y en a) grâce au bouton :
Prévisualisation des images
Une prévisualisation des images a été ajoutée à l'ouverture des fichiers quand le fichier sélectionné est un format d'image valide. Les dimensions de l'image sont également affichées.
Commentaires de noeud et d'arc
Les commentaires des noeuds et des arcs peuvent être affichés séparément.
Édition des propriétés depuis le menu du noeud
Toutes les propriétés du noeud peuvent être éditées directement par le menu contextuel.
Réorganisation du menu Inférence
Le menu Inférence a été divisé en deux menus : le menu Analyses contenant toutes les analyses graphiques et rapports d'analyse et le menu Inférence contenant l'étiquetage et l'inférence hors-ligne ainsi que le questionnaire adaptatif.
Sécurité
Proxy avec authentification
Quand le processus de validation automatique de la licence est utilisé, l'utilisateur peut configurer l'utilisation d'un proxy pour la connexion Internet en spécifiant l'identifiant et le mot de passe. pour l'authentification.
Moniteurs
Probabilité jointe du réseau et autres
La probabilité jointe du réseau est affichée dans la partie supérieure du panneau des moniteurs. Si le réseau possède une base de données, le nombre de cas de la base est affiché. Si les différentes modalités des noeuds ont des valeurs associées, les valeurs totale et moyenne du réseau sont affichées.
Affichage de la couleur des noeuds dans les moniteurs
Si une couleur est associée à un noeud, elle sera affichée en bordure du moniteur correspondant.

Indicateur temporel
L'indicateur temporel n'est plus représenté par un noeud mais a été inclus en tant qu'icône en bas à droite de la fenêtre du réseau. Un click dessus permet de supprimer l'utilisation de la variable temps dans le réseau.
Apprentissage
Optimisations de l'apprentissage
Les algorithmes d'apprentissage EQ et SopLEQ ont été complètement réécrits et sont beaucoup plus efficaces. Le temps d'apprentissage a été réduit de 10% en moyenne.
Optimisations de la complétion
Le basculement entre différents mode de complétion des valeurs manquantes est plus rapide.
Les méthodes de complétion pendant l'apprentissage ont été améliorées.
Taux de compression
Un taux de compression est disponible dans la console. Cette nouvelle mesure indique le taux de compression des données obtenu par le réseau Bayésien appris relativement au réseau précédent (généralement le réseau complètement déconnecté). Cet indicateur reflète non seulement les liens probabilistes entre les variables mais également la force de ces liens.
Dans le cas d'une base de données avec deux variables binaires strictement identiques, le réseau appris aura deux variables reliées par un arc et une table de probabilités conditionnelle indiquant que la valeur de la seconde variable est définie de manière déterministe par la première. Le taux de compression de ce réseau sera alors de 50%.
Inférence
Imputation des valeurs manquantes dans la base de données associée
Dans le menu Données, vous pouvez utiliser le nouveau menu Imputation afin de procéder à l'imputation des valeurs manquantes de la base de données chargée. Vous pouvez choisir d'imputer les valeurs manquantes par un tirage suivant la loi ou suivant le maximum de vraisemblance. La base de données générée sera sauvegardée dans un fichier.

Actualisation bayésienne interactive
L'actualisation bayésienne interactive permet de considérer la base de données associée au réseau comme un fichier d'observations. Ce fichier peut alors être utilisé pour mettre à jour la distribution de probabilités des noeuds déclarés "non observables" en accord avec les observations des autres noeuds lues interactivement dans le fichier. Alors que chaque observation peut impacter l'ensemble des distributions des noeuds non observés, seules les distributions de noeuds "non observables" sont mises à jour après chaque observation. Ce mode affiche une nouvelle barre d'outils qui permet d'effectuer l'actualisation pas à pas ou bien sur la totalité des exemples :
Le bouton
permet de revenir au premier exemple de la base d'observations et de réinitialiser les distributions de probabilités des noeuds "non observables". Le bouton
effectue une actualisation depuis l'index courant jusqu'au dernier index de la base. Ce processus peut alors être interrompu à tout moment en cliquant sur le feu rouge de la barre d'état. Le bouton
provoque l'observation décrite dans la ligne suivante du fichier. Le champ texte indique l'index de l'exemple courant. Il est possible d'entrer directement un index dans ce champ pour effectuer l'actualisation depuis l'index courant jusqu'à l'index spécifié. Si le nouvel index est inférieur à l'index courant, les distributions de probabilités sont réinitialisées et l'actualisation se fait de l'index 0 à l'index spécifié. Le bouton
valide les mises à jour des tables de probabilités. Le bouton
arrête l'actualisation interactive et réinitialise les tables de probabilités des noeuds "non observables". Il supprime également toutes les observations.
Inférence interactive
L'inférence interactive permet d'utiliser la base de données associée au réseau comme fichier d'observations. Ce mode affiche une nouvelle barre d'outils qui permet de naviguer à travers les enregistrements contenus dans la base de données :
Le bouton
permet de revenir au premier exemple de la base de donnée, le bouton
navigue jusqu'au dernier. Le bouton
va à l'exemple précédent si c'est possible et le bouton
va au prochain. Le champs indique l'index de l'exemple courant. On peut également entrer un index dans le champ pour y aller directement. Le bouton
arrête l'inférence interactive et supprime toutes les observations.
A chaque exemple, les noeuds sont observés avec la valeur correspondante dans la base de données sauf si cette valeur est manquante ou que le noeud est déclaré "non observable" ou "noeud cible". Pour les noeuds qui n'ont pas été observés, leur distribution de probabilités est calculée et affichée dans les moniteurs. Si un noeud n'est pas observé parce que c'est le noeud cible ou bien qu'il est non observable et qu'il existe une valeur correspondante dans la base de données, alors celle-ci est indiquée dans le moniteur par la couleur bleu ciel. La probabilité jointe et le nombre de cas correspondant sont également recalculés.
Dans l'image suivante, Cancer est le noeud cible (fond rose) et n'est pas observé. La valeur correspondante dans la base est Non (bleu ciel) et correspond à la valeur prédite par le réseau (99,97%). Le noeud TbOuCa n'est pas observé car il est déclaré comme non observable (fond mauve) et la valeur correspondante dans la base est Faux (bleu ciel). Le noeud Fumeur n'est pas observé car la valeur correspondante est manquante dans la base de donnée. Tous les autres noeuds sont observés avec la valeur correspondante de la base de données :

Ce mode permet de voir interactivement le comportement du réseau et de vérifier de sa validité.
Inférence hors-ligne
L'inférence hors-ligne a été ajoutée pour permettre d'inférer les distributions de probabilités des noeuds déclarés "non observables" en fonction des cas décrits dans un fichier. Le processus d'inférence hors-ligne peut être interrompu à n'importe quel moment sans perdre les données calculées. Les données déjà générées sont sauvegardées dans la base de données de sortie.
Étiquetage hors-ligne
Le processus d'étiquetage hors-ligne peut être également interrompu à n'importe quel moment sans perdre les données calculées. Les données déjà générées sont sauvegardées dans la base de données de sortie. Un noeud avec un coût "non observable" n'est pas observé, même si ses valeurs sont contenues dans le fichier.
Nouvel outil d'analyse des gains
La courbe des gains a été enrichie (boîte à outils d'analyse "Performance du réseau") afin d'analyser automatiquement les gains économiques attendus avec le modèle évalué. Ces calculs reposent sur la définition de coûts unitaires correspondant au traitement de chaque individu (axe des abscisses), de gains unitaires correspondant à chaque réponse positive (axe des ordonnées), et enfin d'une taille de population cible. Le gain économique est alors défini comme la différence entre le gain correspondant au traitement de x% de la population et le gain correspondant au traitement de la totalité de la population. Comme le montre la copie d'écran ci-dessous, le résultat est présenté à la fois sous forme graphique (courbe bleue) et par l'intermédiaire de la couleur (plus on est proche du jaune, plus on est proche de l'optimalité).
Les paramètres économiques peuvent être modifiés dans la boîte de dialogue suivante :
Algorithme de réduction de la complexité
Nous avons développé un nouvel algorithme de réduction de la complexité des réseaux qui sont trop connectés pour permettre la création de l'arbre de jonction, et donc, pour lesquels l'inférence exacte est impossible. Cet algorithme simplifie incrémentalement la structure du réseau jusqu'à ce que l'inférence exacte puisse être effectuée.

Après réduction, un rapport contenant tous les arcs supprimés est affiché.
Corrélation de Pearson
L'association de valeurs aux modalités des noeuds nous permet désormais de calculer le coefficient de corrélation linéaire R de Pearson entre deux noeuds reliés par un arc. Si les modalités n'ont pas de valeurs associées, des valeurs par défaut sont définies pour le calcul de R (de 0 à n-1 pour un noeud à n modalités). L'épaisseur des arcs est directement proportionnelle à la valeur absolue de R, sa couleur au signe de R (bleu si positif, rouge sinon). La valeur exacte de R pour chaque arc est temporairement affichée dans le commentaire de l'arc. Elle a également été ajoutée au rapport d'analyse des relations.
Squelette du réseau
En mode Validation, le réseau peut être affiché sans les têtes des arcs pour permettre d'éviter une analyse causale erronée de la direction des flèches. Cette option est activée en pressant le bouton qui convient dans la barre d'outils :
Préférences
Édition
Une option a été ajoutée dans les préférences d'Édition pour choisir le comportement du logiciel lorsqu'un noeud a été créé :
- une fois qu'un noeud ou un arc a été créé, le logiciel revient automatiquement en mode sélection
- le logiciel revient en mode sélection quand l'utilisateur fait un click droit.
Base de données
Il est possible de spécifier dans les préférences certaines valeurs par défaut des options de l'importation de données :
- mode de complétion des valeurs manquantes (statique, dynamique ou EM structurel),
- le type de discrétisation (égalles distances ou fréquences),
- le nombre d'intervalles.
Inférence
Il est possible de modifier le paramétrage de l'algorithme de réduction de la complexité des réseaux. En fonction de la mémoire vive disponible, on peut augmenter au réduire le taux de réduction.







