BayesiaLab 4.0 : les nouveautés
Définir plusieurs valeurs manquantes différentes
Il est maintenant possible de définir différentes valeurs manquantes pour une base de données.

Nouvel assistant d'association
Fondé sur le nouvel assistant d'importation, l'assistant d'association de bases de données permet de lier une base de données à un réseau existant avec beaucoup de souplesse et de précision. Les modalités peuvent être liées une à une ou bien être agrégées en une seule modalité. Une variable discrète peut être associée à un noeud intervalle. De nouveaux noeuds peuvent être également ajoutés.
Un mécanisme d'avertissement permet maintenant de gérer rapidement et simplement les différents problèmes et conflits qui peuvent apparaître pendant une association. Chaque information est notifiée dans une liste et un double-clic sur un élément de cette liste affiche l'éditeur d'association de modalités permettant la résolution du problème.
Amélioration de l'agrégation automatique
Le mécanisme d'agrégation permet de rassembler les modalités discrètes qui ont un comportement similaire vis-à-vis de la variable et de la modalité cible. Le processus de calcul des corrélations a été modifié et un algorithme d'agrégation automatique a été développé.

Nouvel algorithme d'agrégation automatique
Un nouvel algorithme d'agrégation automatique fondé sur un arbre de décision génère les meilleurs agrégats étant donnés la variable et la modalité cibles ainsi que le nombre maximal de modalité désiré.

Nouvelle agrégation multiple
Fondée sur le nouvel algorithme d'agrégation automatique, une nouvelle interface a été ajoutée afin de permettre l'agrégation automatique de plusieurs variables à la fois. Ces variables sont choisies, parmi la sélection, en fonction de leur nombre initial de modalités.

Sauvegarde des agrégats
Afin de garder et de réutiliser les agrégats, ils sont maintenant sauvés dans le fichier du réseau bayésien.
Transfert des points de discrétisation
Une fois qu'une variable a été discrétisée manuellement, il est possible de transférer ses seuils de discrétisation à d'autres variables continues. Si les domaines des variables cibles sont plus petits que celui de la variable courante, ils seront agrandis afin de contenir le domaine de la variable initiale.

Les poids sont utilisés pour la discrétisation et l'agrégation
La variable de pondération des individus est utilisée le cas échéant pour les discrétisations par arbre de décision et par égales fréquences ainsi que dans l'algorithme d'agrégation automatique.
Boutons Sélectionner tout
Lors du processus de discrétisation et d'agrégation, deux boutons permettent la sélection de l'ensemble des variables continues pour permettre des discrétisations multiples et de l'ensemble des variables discrètes pour permettre les agrégations multiples.

Sauvegarde intermédiaire de la base de données
Pendant le processus d'import ou d'association, un bouton permet de sauvegarder la base de données intermédiaire telle qu'elle a déjà été traitée. Cette fonction est très utile quand un processus d'import est long et doit être refait ensuite.

Redimensionnement automatique des colonnes
Un double-clic sur la partie droite de l'en-tête d'une colonne redimensionne toutes les colonnes sélectionnées à la taille préférée de leur en-tête. Cette fonction est disponible dans les assistants d'import et d'association.
Graphiques
Éditeur de graphiques
Un nouvel outil d'analyse graphique a été ajouté : l'éditeur de graphiques. Il permet de créer différents types de graphiques sur les variables du réseau. Il utilise les valeurs stockées dans la base de données. Il permet également d'afficher des graphiques avec des valeurs continues exactes si la base de données les a stockées pendant l'import. Une option dans les préférences permet de changer ce comportement.

Les graphiques sont modifiables en changeant leurs paramètres spécifiques.
Les graphiques sont très interactifs :
- vous pouvez afficher les données correspondant aux points sélectionnés
- vous pouvez zoomer en sélectionnant la zone que vous voulez agrandir
- les coordonnées de la position du pointeur de la souris dans le graphique sont affichées
- le nombre de points affichés dans la zone est indiqué
- ...

Interface
Noeuds intervalles affichés différemment
Les noeuds intervalles (correspondant à des variables à valeurs numériques continues) sont maintenant affichés avec une bordure discontinue au lieu de la bordure pleine précédente afin d'être identifiés immédiatement.
Sélection de noeuds
Il est maintenant possible de sélectionner les noeuds directement ou indirectement connectés au noeud courant ou encore de sélectionner les noeuds qui font partie de la couverture de Markov (parents, enfants et épouses) du noeud courant.

Ces actions sont accessibles à partir du menu contextuel du noeud.
Liste des couleurs des catégories
La liste des couleurs utilisées par les catégories (définie par l'intermédiaire du dictionnaire) a été modifiée afin d'obtenir une plus grande différence de teinte entre chaque couleur. Les modifications faites sur cette liste par l'utilisateur sont sauvegardées.
Marques de couleur des catégories affichées dans les commentaires
Pour améliorer la lisibilité du graphe, si une catégorie de couleur est définie pour un noeud, cette couleur est maintenant affichée dans la bordure du commentaire en haut et à gauche.
Édition des noeuds avec le commentaire affiché
Lorsque les commentaires sont affichés, le noeud peut être déplacé, sélectionné ou édité en déplaçant, cliquant ou double-cliquant directement sur le commentaire.

Valeurs manquantes et poids d'une base de données
Si la base de données associée à un réseau contient des valeurs manquantes et/ou possède une variable de pondération, l'icône en bas à droite de la fenêtre l'affiche. L'icône verte indique que la base de données a des poids spécifiés et l'icône orange indique que la base de données contient des valeurs manquantes.
Éditeur de noeud
Matrice d'occurrences
Lorsqu'un réseau possède une base de données associée, un nouveau mode de visualisation est disponible dans l'éditeur de noeud. Ce mode affiche une table montrant combien de fois les modalités du noeud sont présentes dans la base de données. Le nombre d'occurrences tient compte des éventuels poids et des éventuelles occurrences virtuelles.
Éditeur d'agrégats
Tous les alias associés aux modalités, créés lorsqu'une base est importée ou associée, peuvent être édités avec le bouton Agrégats dans l'éditeur de noeud. Cette fonction est disponible pour les noeuds discrets et les noeuds intervalles.

Vous pouvez ajouter ou supprimer des noms associés à la modalité sélectionnée.

Moniteurs
Moyenne et écart-type
Si les valeurs continues sont importées, la moyenne et l'écart-type calculés affichés dans les moniteurs des noeuds intervalles sont calculés à partir de ces données continues.

Commentaires au lieu des noms dans les moniteurs
Vous pouvez basculer entre l'affichage du nom du noeud dans les moniteurs et l'affichage du commentaire associé grâce au menu contextuel.
Le commentaire du noeud est affiché à la place du nom.

Commentaires dans l'info-bulle du moniteur
Le commentaire d'un noeud est affiché dans l'info-bulle des moniteurs.
Apprentissage
Optimisations de l'apprentissage
Le temps moyen d'apprentissage d'un réseau a été divisé par 2. Ces optimisations sont particulièrement efficaces pour les base de données contenant un grand nombre de lignes.
Menu imputation
L'algorithme d'imputation peut être changé même après l'import ou l'association.
Commentaire automatique
Après avoir appris un réseau, un commentaire est ajouté automatiquement au réseau indiquant le nom et les caractéristiques de la base de données, les paramétrages, etc.
Amélioration de l'imputation
Un nouvel algorithme d'imputation statique est maintenant disponible et l'algorithme d'imputation dynamique a été amélioré.
Apprentissage semi-supervisé
Un nouvel algorithme d'apprentissage est maintenant disponible. Cet algorithme semi-supervisé permet d'apprendre un réseau incrémentalement à partir d'un noeud cible jusqu'au nombre d'arcs alloué en profondeur.

Cet algorithme est une extension de l'algorithme recherchant la Couverture de Markov. Il est particulièrement utile pour l'apprentissage rapide de réseaux restreints même lorsqu'il y a des centaines ou des milliers de noeuds. Il permet également une analyse plus poussée que celle obtenue par l'intérmédiaire de la Couverture de Markov et peu permettre une prédiction plus précise de la cible si les variables de la Couverture de Markov possèdent des valeurs manquantes lors de l'exploitation.
Apprentissage des politiques statiques
L'apprentissage des politiques statiques a été complètement refait. Basé sur la programmation dynamique, il permet le calcul exacte des politiques d'actions optimale pour les réseaux Bayésiens statiques.
Inférence
Probabilité jointe et nombre d'exemples
La probabilité jointe courante du réseau (ie. celle prenant en compte les observations positives, négatives aisni que les vraisemblances) est affichée en bas à droite de la fenêtre. Si une base de données est associée au réseau, une estimation du nombre d'exemples correspondant est aussi affiché.

Amélioration des analyses
L'efficacité des méthodes d'analyses a été améliorée notamment par la restriction du domaine aux noeuds dépendants.
Demande de la modalité préférée
Pendant l'évaluation ciblée ou l'exploitation hors-ligne, il est possible d'obtenir plusieurs modalités du noeud cible avec la même probabilité. Maintenant, au lieu de choisir la première modalité par défaut, l'algorithme demande à l'utilisateur de faire son choix lui-même.

Préférences
Langue
La langue utilisée dans BayesiaLab peut être changée et sera effective après redémarrage de BayesiaLab.

Le support du Japonais a été ajouté.

Nombre d'itération pour EM/Imputation
Le nombre d'itérations utilisée par les algorithmes EM et d'imputation peut être modifié.

Influence de la complexité structurelle
Les bornes de l'influence de la complexité structurelle ont été modifiées.
Normalisation des poids
La normalisation des poids peut être activée ou non et le facteur de normalisation peut être modifié.

Format de sauvegarde des données
Le format des fichiers de sortie peut être modifié. Il est possible de changer le séparateur de colonne et de spécifier si le point doit être utilisé comme caractère de fin de ligne.

Import des valeurs continues exactes
Les valeurs continues exactes peuvent être importées quand la base de données est chargée. Cette option permet d'utiliser le nouvel éditeur de graphiques avec des dimensions continues et permet de calculer la moyenne et l'écart-type de chaque noeud intervalle dans les moniteurs.






