English Recherche

BayesiaLab 4.3 : les nouveautés


Données


Import/Export de dictionnaires d'images

 

Il est possible de d'importer et d'exporter des dictionnaires d'images associées aux noeuds. Le dictionnaire contient une série d'association entre un nom de noeud ou de classe et le chemin d'une image par rapport au répertoire dans lequel se trouve le fichier du dictionnaire. Lorsque l'on exporte les images, les images sont sauvegardées dans le même répertoire que le dictionnaire. Elles sont au format png.

Association automatique des modalités des noeuds avec les noms longs

 

Lorsque que l'on associe une base de données contenant les noms longs des modalités au lieu de leurs noms, ces noms longs sont automatiquement associés aux modalités correspondantes.

Boutons pour l'extension des bornes à l'association

 

Lors de l'association d'une base de données, il peut arriver que, pour les noeuds continus, certaines valeurs de la base de données soient en dehors du domaine du noeud correspondant. Il est possible d'étendre le domaine du noeud pour chaque noeud. Cependant, lorsqu'il y a beaucoup de noeuds dans ce cas, ces deux boutons, "Minima de la base" et "Maxima de la base", permettent d'étendre les bornes globalement pour tous les noeuds concernés. Le boutons "Limites du réseau" permet de filtrer les lignes dont les valeurs sont hors des bornes des noeuds.

Valeurs étendues


Préférence pour importer les entiers en tant que modalités discrètes

 

Il est possible, à travers les Préférences, de définir comment sera interprété, à l'import, une colonne ne contenant que des valeurs entières. On peut spécifier en dessous de quel nombre de modalités entières distinctes le noeud sera considéré automatiquement comme un noeud discret et non un noeud continu. Au dessus de ce nombre le noeud sera considéré, a priori, comme un noeud continu. Il est toujours possible de changer le type du noeud manuellement.

Importation discrete


Attribution automatique de valeurs pour les modalités des variables continues

 

A l'import ou l'association de bases, il est possible d'associer comme valeur de chaque modalité d'un noeud continu, la moyenne des valeurs contenues dans la base et correspondant à un intervalle. Cette propriété peut être modifiée séparément pour l'import et l'association dans les Préférences.

Intervalles


Sélection multiple des modalités dans le filtrage à l'import

 

Lorsque l'on filtre les données d'une colonne à l'import, il est maintenant possible de sélectionner plusieurs modalités à la fois et d'appliquer le filtre sur la sélection au lieu de devoir le faire les unes après les autres. Cela augmente d'autant la vitesse de filtrage sur les grosses bases de données.

Boutons de sélection des tous les continus ou discrets lors du filtrage à l'import

 

Il est maintenant possible de sélectionner toutes les colonnes continues et toutes les colonnes discrètes au moment du filtrage des données à l'import grâce à deux nouveaux boutons. Ceci permet d'appliquer des filtre facilement sur tous les continus ou tous les discrets.

Colonnes discretes ou continues


Choix de sauvegarder les données des noeuds sélectionnés uniquement

 

Si l'on sélectionne un ensemble de noeuds avant de sauvegarder la base de données associée au réseau, l'assistant va proposer de ne sauvegarder que les données correspondant aux noeuds sélectionnés ou bien de sauvegarder la base entière.

Sauvergarde des noeuds


Choix de sauvegarder les noms longs pour les noeuds continus

 

Un nom long peut être associé à chaque modalité d'un noeud continu. Par défaut, lors de la sauvegarde, le nom de la modalité ou bien la valeur continu, si elle existe, sont utilisés. Il est maintenant possible d'utiliser le nom long de la modalité. Ceci est valable également pour l'imputation, la génération de base, etc.

Nom long


Choix de sauvegarder ou de générer la valeur continue d'un noeud continu

 

Lorsque l'on sauvegarde une base de données associée à un réseau qui contient des noeuds continues, il est possible de sauvegarder les valeurs continues présentes dans la base, si elles existent, au lieu du nom des modalités. Lorsqu'il n'y a pas de valeurs continues dans la base mais uniquement le nom des modalités des noeuds continues, les valeurs seront générées automatiquement. Pour chaque modalité de la base, un nombre est tiré aléatoirement de manière uniforme entre les bornes de l'intervalle correspondant. Ceci est également valable pour l'imputation, la génération de base, etc.

Valeurs continues


Base de données d'apprentissage et de test

 

Il est maintenant possible d'affecter une partie d'une base de données à l'apprentissage et l'autre partie aux tests (c'est à dire aux analyses qui nécessitent une base de données telles que la performance ciblée du réseau, l'inférence interactive, etc.). Pour spécifier quelles sont les lignes qui doivent être utilisées pour l'apprentissage et pour le test, une interface a été ajoutée dans les assistants d'import et d'association de bases de données. Il est possible de définir une colonne ayant uniquement deux modalités comme colonne définissant le type de la ligne (apprentissage ou test).

Apprentissage ou test

Il est possible ensuite d'attribuer l'apprentissage à une des deux modalités et donc le test à l'autre.

Apprentissage ou test

Lorsqu'il n'y a pas de type, toute la base est utilisée pour l'apprentissage et l'analyse.


Typage des données en apprentissage/test automatique à l'import

 

A l'import ou l'association, lorsque l'on ne possède pas de colonne qui permette de typer les données en données pour l'apprentissage et données pour le test, il est possible de définir un pourcentage de ligne qui seront dédiées aux tests.

Typages automatique

La boîte de dialogue suivante permet de définir ce pourcentage :

Typages automatique

Les lignes seront choisies aléatoirement dans la base après l'étape de filtrage.

Le choix d'utiliser une colonne pour typer les données ne sera plus possible.


Choix du type de données pour la sauvegarde, l'imputation et la génération de la base

 

Lorsqu'une base de données possède des données pour l'apprentissage et pour le test, au moment de la sauvegarde ou de l'imputation de la base, l'utilisateur peut choisir entre les données d'apprentissage, les données de test ou les deux à la fois.

Sauvegarde du typage

Lorsque l'on génère une base de donnée, on peut également choisir de générer des données pour l'apprentissage et des données pour le test.

Génération


Poids et types sauvés en premières colonnes de la base de données

 

Si une base de données possède une colonne de poids et/ou une colonne de types, ces deux colonnes seront sauvegardées en premier lors de la sauvegarde de la base.

Discrétisation par K-Means

 

Un nouvel algorithme de discrétisation des variables continues a été introduit dans BayesiaLab : c'est l'algorithme des K-Means. Il permet de discrétiser très efficacement les noeuds continus surtout lorsque l'on ne possède pas de noeud cible pour l'arbre de décision.

K-means


Utilisation des K-Means si l'arbre de décision échoue

 

Lors de la discrétisation des noeuds continus à l'import, si l'arbre de décision a été demandé sur une variable et qu'il échoue à trouver une bonne discrétisation, l'algorithme des K-Means sera utilisé à la place au lieu de la discrétisation par égales fréquences.

Analyse


Optimisation de la modalité cible

 

Cette fonction permet de rechercher les n-uplets permettant soit de maximiser la probabilité de la modalité cible (maximisation de la vraisemblance), soit de maximiser l'a posteriori (probabilité de la modalité cible sachant le n-uplet pondérée par la probabilité d'occurrence du n-uplet). Le contexte des observations est pris en compte dans l'analyse.

Le panneau de configuration permet de restreindre la recherche aux noeuds sélectionnés. La taille des observations correspond à la taille de n-uplets que l'on veut obtenir. Il est possible d'associer les résultats en tant que base de données interne : il suffit de choisir le nombre d'exemples que l'on veut associer. Il est possible, si l'on arrête la recherche avant, que l'on n'obtienne pas le nombre d'exemples désirés. Afin que la base de données ne soit pas utilisée pour l'apprentissage, du fait qu'elle possède une structure particulière avec des colonnes entièrement manquantes, les données sont typées en tant que données de test.

Il est possible de sauver les n-uplets dans un fichier en le spécifiant. La sauvegarde des observations peut être filtrée de 5 manières différentes afin de ne garder que les combinaisons d'observations intéressantes. Les trois premières possibilités sont :

  • La vraisemblance est supérieure à la probabilité initiale de la cible
  • La vraisemblance est supérieure à la meilleure vraisemblance trouvée
  • La vraisemblance est supérieure à la valeur définie (la valeur est définie entre 0 et 1)

Dans le cas où l'on prend en compte la probabilité a posteriori des observations, deux autres possibilités de filtre s'ajoutent : 

  • La probabilité a posteriori est supérieur à la meilleure probabilité a posteriori trouvée
  • La probabilité a posteriori est supérieur à la valeur définie (la valeur est définie entre 0 et 1)

Optimisation


Analyse de sensibilité d'un noeud cible

 

Cet outil permet de visualiser graphiquement l'impact des différentes variables du réseau sur chaque modalité de la variable cible. La plage de variation de chaque modalité est affichée en fonction des valeurs de chaque noeud. Les plages de variation sont triées de bas en haut de la plus forte à la plus faible. Le premier onglet représente l'ensemble des variations toutes les modalités sur un seul graphique. Les onglets suivants représentent les variations pour chaque modalité.

L'analyse se fait sur l'ensemble des noeuds du réseau ou bien sur un sous-ensemble de noeuds sélectionnés. Le contexte des observations est pris en compte et affiché en dessous des graphiques lorsque c'est nécessaire. Un menu contextuel permet d'afficher les commentaires associés aux noeuds à la place des noms. Il permet aussi de copier les graphiques en tant qu'image.

Sensibilité

Sensibilité

Sensibilité


Analyse de sensibilité des paramètres

 

Cet outil permet, par le biais d'un échantillonnage, de mesurer l'impact de l'incertitude associée aux noeuds "paramètres" sur les noeuds cibles. Les noeuds paramètres sont par défaut les noeuds racines (i.e. sans parent), les noeuds cibles étant par défaut les noeuds feuilles (i.e. sans enfant). Le résultat de la simulation peut être stocké dans un fichier. Le contexte des observations est pris en compte dans l'analyse.

Paramètre de sensibilité

Le résultat de l'analyse se présente sous deux formes : une courbe représentant la fonction de répartition des probabilités de chaque modalité, ou un histogramme représentant la fonction de densité de probabilités. Outre ces courbes, la moyenne et l'écart-type des probabilités des modalités cibles sont également affichées. La moyenne correspond bien entendu à la probabilité marginale affichée dans les moniteurs.

Paramètre de sensibilité

Paramètre de sensibilité

L'analyse se fait sur l'ensemble des noeuds du réseau ou bien sur un sous-ensemble de noeuds sélectionnés. Le contexte des observations est pris en compte et affiché en dessous des graphiques. Un menu contextuel permet de copier les graphiques en tant qu'image.


Rapport de segmentation des variables

 

Un rapport html de la segmentation des variables est maintenant affiché lorsque l'on valide la segmentation courante :

Rapport de la segmentation


Dendrogramme pour la segmentation des variables

 

Le bouton Dendrogramme a été rajouté à la barre d'outil de la segmentation des variables afin d'afficher la représentation hiérarchique de la segmentation courante sous forme d'un dendrogramme. Il est toujours possible de faire varier interactivement le nombre de clusters désiré et d'observer le résultat sur le graphique. Un menu contextuel permet d'afficher le commentaire associé au noeud à la place du nom et de copier le graphique sous forme d'image.

Dendrogramme


Performance globale du réseau

 

Cet outil permet de calculer un indice de performance globale du réseau en fonction de la base de données associée. La valeur calculée correspond à la log-vraisemblance.

Si la base de données contient des données pour l'apprentissage et des données pour le test, l'analyse se fait pour chaque type de base sinon elle s'effectue sur l'ensemble des données de la base. Lorsque l'on a une base de données de test, on peut comparer le résultat obtenu sur la base de données d'apprentissage avec celui obtenu sur la base de données de test.

Les résultats sont affichés sous forme de graphiques dans une fenêtre. Il y a un onglet pour chaque type de base (apprentissage et test). Pour chaque base on peut visualiser les résultats soit sous forme d'une fonction de densité dans laquelle on peut faire varier dynamiquement le nombre d'intervalles, soit sous forme d'une fonction de répartition.

Fonctions de densité

Performance globale d'apprentissage

Fonctions de répartition

Performance globale d'apprentissage

Les graphiques pour la base d'apprentissage et la base de test sont à la même échelle ce qui permet de les comparer visuellement très facilement en changeant simplement l'onglet sélectionné.

Lorsqu'un exemple d'une des bases est impossible, c'est-à-dire qu'il donne lieu à une combinaison impossible d'observations, l'exemple n'est pas pris en compte dans le calcul final et est affiché dans un tableau dans un rapport html. Ce rapport est affiché en appuyant sur le bouton des lignes ignorées.

Performance globale d'apprentissage


Mode d'analyse de l'explication la plus probable MPE

 

Cet outil permet de calculer l'explication la plus probable, c'est-à-dire le cas correspondant à la probabilité jointe maximale. Les moniteurs sont utilisés pour la mettre en évidence. La probabilité de chaque modalité est remplacée par la vraisemblance que cette modalité appartienne à la configuration la plus probable. Le contexte des observations est pris en compte dans l'analyse. A chaque fois qu'une observation est faite, l'explication la plus probable est recalculée et les moniteurs sont mis à jour. La probabilité jointe affichée dans la partie supérieure de la zone des moniteurs affiche la probabilité jointe de cette explication la plus probable.

MPE


Analyse graphique du voisinage d'un noeud

 

Ce type d'analyse permet de visualiser, pour le noeud sélectionné, quelle est l'ensemble des noeuds rattachés à lui selon le mode choisit dans la barre d'outils :

Analyse graphique du voisinage d'un noeud

Les noeuds qui ne sont pas rattachés au noeud sélectionné sont rendus translucides et ne sont plus sélectionnables. Lorsque l'on clique sur un noeud visible, les noeuds non rattachés à lui deviennent translucides. Pour faire réapparaître tous les noeuds, il suffit de cliquer partout sauf sur un noeud visible.

Il est possible d'afficher, grâce à la boîte de choix :

  • La couverture de Markov
  • Les épouses
  • Les parents. Il est possible de spécifier jusqu'à quelle distance les ancêtres sont affichés grâce au champ correspondant.
  • Les enfants. Il est possible de spécifier jusqu'à quelle distance les descendants sont affichés grâce au champ correspondant.
  • Les voisins. Il est possible de spécifier jusqu'à quelle distance les voisins sont affichés grâce au champ correspondant.

Dans l'exemple suivant, on affiche la couverture de Markov du noeud sélectionné, c'est-à-dire que les noeuds non concernés sont rendus translucides :

Analyse graphique du voisinage d'un noeud


Pourcentage de contribution globale de l'indice KL

 

Dans le rapport d'analyse des relations, une colonne contenant le pourcentage de contribution globale de la distance de Kullback-Leibler de chaque arc a été ajoutée.

Améliorations de l'analyse de Pearson

 

L'association de valeurs aux modalités des noeuds nous permet de calculer le coefficient de corrélation linéaire R de Pearson entre deux noeuds reliés par un arc. Si les modalités n'ont pas de valeurs associées, des valeurs par défaut sont définies pour le calcul de R (de 0 à n-1 pour un noeud à n modalités). L'épaisseur des arcs est directement proportionnelle à la valeur absolue de R, sa couleur au signe de R (bleu si positif, rouge sinon). La valeur exacte de R pour chaque arc est temporairement affichée dans le commentaire de l'arc.

Note : s'il n'y a pas de valeurs associées aux modalités d'un noeud alors l'index, à partir de 0, de la modalité est utilisé. Si le noeud est continu alors la moyenne de chaque intervalle est utilisée comme valeur. Si le noeud possède des modalités entières, ces modalités seront utilisées comme valeurs.

Barre d'outils

Vous pouvez, grâce à cette gâchette, faire varier le seuil d'affichage des arcs en fonction des boutons de filtre sélectionnés :

  • corrélation négative  Affichage uniquement des arcs ayant une corrélation négative et supérieure au seuil indiqué en valeur absolue
  • corrélation supérieure au seuil indiqué  Affichage uniquement des arcs ayant une corrélation supérieure au seuil indiqué en valeur absolue
  • corrélation positive  Affichage uniquement des arcs ayant une corrélation positive et supérieure au seuil indiqué

Si tous les arcs d'un noeuds sont devenus transparents, le noeud devient lui-même transparent.


Inférence


Inférence MPE hors-ligne

 

Pour chacun des noeuds déclarés non observables, cible et cachés, on calcule, pour chaque cas décrit dans la base de données traitée, l'explication la plus probable et l'ensemble des vraisemblances est enregistré.

Les résultats sont stockés dans un fichier d'exploitation reprenant les champs sélectionnés du fichier d'entrée et associant, pour chaque modalité de chaque noeud non observable, la vraisemblance calculée.


Étiquetage MPE hors-ligne

 

On infère avec le calcul de l'explication la plus probable, pour chaque cas décrit dans la base de données traitée, la valeur la plus probable de chaque variable cible. Les variables cibles sont les noeuds déclarés non observables, cible et cachés.

Les résultats sont stockés dans un fichier d'exploitation reprenant les champs sélectionnés du fichier d'entrée et associant la valeur prédite accompagnée de la probabilité sur laquelle repose la prédiction.


Optimisation de l'inférence hors-ligne

 

L'algorithme de l'inférence hors-ligne a été optimisé de manière à accélérer énormément le calcul lorsque toutes les variables appartenant à la couverture de Markov du noeud cible sont observées.

Apprentissage


Stratification

 

Lorsque la valeur cible à prédire est peu représentée (comme la fraude généralement), la stratification permet de modifier la distribution de probabilités de la variable cible (en affectant un poids interne à chaque modalité). Cette modification de la distribution de probabilités permet alors d'apprendre un réseau structurellement plus riche. A l'issue de l'apprentissage, les paramètres (i.e. les distributions de probabilités) sont bien entendu réestimées sur les données non stratifiées.

La boîte de dialogue suivante permet d'indiquer quelle est la proportion de chaque modalité du noeud spécifié que l'on veut obtenir. La valeur initiale affichée est la proportion présente dans la base. Il suffit de déplacer la gâchette ou bien d'éditer directement la valeur pour chaque modalité.

Stratification

Lorsqu'une stratification est effectuée, l'icône Icone s'affiche dans la barre de statut. Il est possible de supprimer la stratification en faisant un clic droit sur cette icône pour faire apparaître le menu contextuel et en choisissant de supprimer la stratification.


Prise en compte des noeuds décision observés dans les politiques statiques

 

Maintenant les observations faites sur les noeuds décision sont prises en compte dans le calcul des politiques statiques.

Arbre de recouvrement maximal

 

S'effectuant en seulement deux passes, cet algorithme est de loin le plus rapide. La première passe consiste à calculer a priori le poids de toutes les relations binaires entre variables, la seconde consiste ensuite à construire l'arbre de recouvrement maximal avec ces relations. Même si le réseau obtenu n'est pas optimal, il peut être utilisé pour une première imputation des valeurs manquantes, comme réseau initial pour une recherche Taboo ou EQ, ou encore pour construire le graphe nécessaire à la segmentation de variables lorsqu'il y a beaucoup de variables.

Il est possible de choisir parmi deux scores différents pour cet apprentissage : le Minimum Description Length et la corrélation de Pearson.

maxSpanningTree

En outre, les arcs fixés (en bleu) sont considérés comme des arcs normaux mais les arcs interdits sont pris en compte.

A la fin de l'apprentissage, on obtient un arbre sans arcs orientés. Pour obtenir un réseau bayésien, ceux-ci le seront de manière à éviter l'introduction de V-structures.


Amélioration de la vitesse d'exécution de la segmentation des individus

 

Plusieurs optimisations ont permis d'améliorer significativement la vitesse d'exécution de l'algorithme de segmentation des individus.

Segmentation semi-supervisée

 

Un éditeur de poids de variables est maintenant accessible dans l'assistant de segmentation des données. Ces poids, qui par défaut sont égaux à 1, permettent d'orienter la segmentation. Un poids supérieur à 1 impliquera une prise en compte plus importante de la variable dans la segmentation. Un poids nul remisera la variable à un rôle purement illustratif.

segmentation des poids


Conservation des arcs fixés pour la segmentation multiple

 

Maintenant les arcs fixés par l'utilisateur dans le réseau initial sur lequel on effectue une segmentation multiple seront copiés dans chacun des sous-réseaux intermédiaires créés si cela est possible, c'est-à-dire que les extrémités de chaque arc doivent appartenir au nouveau sous-réseau.

Valeurs des clusters

 

Afin d'aider à la compréhension des segmentations obtenues, et si au moins une variable utilisée pour la segmentation possède des valeurs numériques associées à ses modalités, les modalités du noeud Cluster auront alors un nom long automatiquement associé. Ce nom contiendra la valeur numérique moyenne sur l'ensemble des variables segmentées lorsque la modalité du Cluster est observée.

Valeurs segmemtations Valeurs segmemtations


Ratio de compression structurelle d'un réseau

 

En plus du calcul du ratio de compression des données, le ratio de compression structurelle du réseau est calculé et affiché dans la console à la fin de n'importe quel apprentissage structurel.

Ce ratio représente le nombre d'arcs courant du réseau divisé par le nombre d'arcs maximum théorique du réseau.

Ce ratio est aussi accessible dans le rapport descriptif du graphe.


Réseau


Export de la couverture de Markov en PHP et JavaScript

 

Deux modules d'export (Exportation) de la couverture de Markov d'une variable cible d'un réseau bayésien ont été ajouté au module SAS existant. Il est donc possible d'exporter en PHP et Javascript afin d'intégrer ces scripts à un contenu web.

Ces deux modules ne sont disponibles qu'à travers Bayesia S.A. qui se charge d'exporter vos réseaux selon vos besoin et d'encapsuler le script afin de le rendre facilement intégrable.

Note : ceci est une option qui n'est pas présente dans les versions classiques de BayesiaLab.


Rapport descriptif du réseau

 

Le menu contextuel du réseau permet de générer un rapport descriptif du réseau en html. Il contient un résumé de la structure du réseau. Si des noeuds du réseau sont en erreur, la liste des erreurs et des warnings est également affichée.

Rapport graphe


Affichage du nombre total de classes et d'arcs interdits

 

Dans l'éditeur de classes, le nombre total de classes utilisées est maintenant affiché et est dynamiquement mis à jour si l'on ajoute ou supprime des classes.

De même, l'éditeur d'arcs interdits affiche dynamiquement le nombre courant d'arcs interdits.


Interdiction des arcs sortant des noeuds contraintes

 

Un noeud contrainte ne peut, par définition, avoir d'enfants, c'est pourquoi l'ajout d'arcs sortant de ce type de noeud a été interdit.

Police de caractères des noms des noeuds éditable

 

Il est maintenant possible de modifier la police de caractères utilisée pour l'affichage du nom des noeuds d'un réseau. On y accède par le menu Propriété qui se trouve dans le menu contextuel du réseau.

Editeur de police

Il est également possible de changer la police de caractères utilisée par défaut pour tous les réseaux dans les préférences. Ceci permet de ne pas avoir à modifier la police pour chaque réseau.


Menu Propriété dans le menu contextuel du réseau

 

Un menu Propriété a été rajouté dans le menu contextuel du réseau. Il rassemble l'ajout ou la suppression de l'image de fond, l'édition de la police de caractère des noeuds et l'édition du commentaire associé au réseau.

Menu Supprimer les arcs non fixés

 

La suppression des arcs non fixés dans le réseau peut se faire grâce au menu rajouté dans le menu contextuel du réseau.

Sélection des noeuds racines connectés

 

Le menu Sélectionner du menu contextuel d'un noeud contient maintenant la possibilité de sélectionner les noeuds racines connectés directement ou indirectement au noeud courant.

Moniteurs


Affichage de l'évolution de la valeur des noeuds dans les moniteurs

 

Au cours des différentes observations faites sur le réseau, la valeur des noeuds, calculée à partir des valeurs associées aux modalités, évolue. L'évolution de cette valeur d'une observation à l'autre est maintenant affichée dans les moniteurs à droite de la valeur courante.

Affichage du nombre de cas correspondant à chaque modalité dans l'info-bulle

 

Lorsqu'une base de données est associée à un réseau, on peut afficher pour chaque modalité de chaque noeud le nombre de cas de la base de données que représente la probabilité de la modalité en fonction des observations faites.

Probabilité de modalités


Calcul des variations d'incertitude et de vraisemblance du réseau

 

Depuis le menu contextuel du panneau des moniteurs, il est possible d'afficher dans le panneau d'information des moniteurs les variations d'incertitude et de vraisemblance du réseau.
  • Incertitude : cette valeur mesure la variation d'incertitude sur les noeuds non observés relativement au réseau complètement déconnecté. Cette mesure repose sur l'entropie (l'entropie la plus élevée correspond aux distributions uniformes, la plus faible correspondant à une probabilité de 100% sur une modalité).
  • Vraisemblance : cette valeur mesure la variation de vraisemblance du réseau bayésien relativement au réseau complètement déconnecté. Cette vraisemblance est calculée avec les probabilités jointes des observations réalisées.

Ces valeurs sont calculées lorsque l'option correspondante est cochée dans le menu contextuel du panneau des moniteurs.


Bouton de fermeture du panneau d'information

 

Un bouton haut/bas permet de fermer (et d'ouvrir) le panneau d'information si celui-ci occupe trop de place dans le panneau des moniteurs.

Panneau d'informations


Interface


Modification du menu Éditer

 

Le menu Éditer contient un nouveau menu qui permet de sélectionner les noeuds discrets, continus, contraintes, décisions ou utilités suivant le sous-menu choisit.

Il contient également un menu permettant de supprimer tous les arcs, les arcs non fixés, les noeuds déconnectés ou les noeuds virtuellement déconnectés (Forces KL).


Optimisation de la sélection des noeuds et des arcs

 

La sélection/désélection des noeuds et des arcs a été grandement améliorée en rapidité.

Centrage des noeuds et des arcs lors de la recherche

 

Lorsque l'on recherche des noeuds ou des arcs avec l'assistant correspondant, les résultats que l'utilisateur sélectionne dans la liste  sont maintenant centrés au milieu de la fenêtre du réseau pour plus de facilité.

Conservation de la taille et de la position de l'éditeur de noeuds

 

Lorsque l'on change de noeud à éditer avec la boîte de choix située dans l'éditeur de noeud, celui-ci garde sa position et ses dimensions actuelles et n'est plus automatiquement centré à l'écran et redimensionné à sa taille initiale.

Noms des noeuds translucides

 

L'affichage du nom des noeuds suit maintenant le comportement graphique du noeud. Si un noeud devient translucide pour diverses raisons, son nom le devient également.

Indicateurs sur l'icône de base de données

 

Deux nouveaux indicateurs ont été ajoutés à l'icône de la base de données : l'indicateur de stratification et l'indicateur de base de test.

Les quatre indicateurs possibles sont donc :

L'icône peut donc ressembler à ça : Icone


Menu contextuel sur l'icône de base de données

 

Un menu contextuel a été ajouté à l'icône de base de données. Il permet, selon les cas, de supprimer la stratification de la base, de supprimer les poids ou bien de supprimer le typage des données.

Noeuds et arcs translucides non sélectionnables

 

Les noeuds et arcs translucides ne sont dorénavant plus sélectionnables. Il faut qu'ils redeviennent visibles pour que l'on puisse de nouveau les sélectionner.

Gestion des calques associés aux classes

 

Un clic droit sur l'icône des classes Icone classe affiche une panneau permettant de sélectionner les classes que l'on veut afficher ou cacher. Il suffit de cocher les classes que l'on veut voir apparaître et de décocher les classes pour les rendre invisibles.

Calques

La case à cocher nommées Toutes est un raccourci pour cocher ou décocher toutes les cases à la fois. Lorsqu'une classe n'est pas affichées, les noeuds qui la composent deviennent translucides et ne sont plus sélectionnables. Si un arc relie deux noeuds translucides, celui-ci devient également translucide.


Scrolling de la fenêtre lorsque l'on tire un arc ou une sélection

 

Lorsque l'on désire tracer un arc dont la taille est supérieur à l'espace affiché, la fenêtre du graphe se déroule automatique dès que la souris approche le bord.

De même, lorsque l'on veut sélectionner une zone qui n'est pas entièrement affichée, la fenêtre se déroule lorsque le curseur de la souris atteint le bord de la fenêtre.


Zoom centré sur la sélection

 

Lorsqu'un noeud ou un ensemble de noeuds est sélectionné et que l'on zoome, l'affichage va resté centré au possible sur cette sélection.

Ajustement de la sélection à la fenêtre

 

Il est maintenant possible d'ajuster à la taille de la fenêtre les noeuds qui ont été sélectionnés. Si aucun noeud n'est sélectionné, l'ajustement se fait sur le réseau en entier.

Prise en compte de la proximité des noeuds d'une classe dans le positionnement génétique

 

Un nouveau facteur de la fonction d'évaluation de l'algorithme de positionnement génétique a été ajouté. Il s'agit du fait de regrouper les noeuds qui appartiennent aux mêmes classes.

Regroupement de noeuds


Modules


Modules de fonctions utilisateurs

 

BayesiaLab permet d'inclure automatiquement des fonctions définies par l'utilisateur dans son éditeur d'équation afin de pouvoir les utiliser pour générer les tables de probabilités conditionnelles des noeuds.
Il est possible d'interfacer du Java, du C, du C++, du FORTRAN, Mathematica, etc. Ceci peut être fait directement ou grâce à JNI ou des librairies spécialisées.
Pour tous renseignements et conseils, vous pouvez contacter Bayesia S.A.

Pour permettre cette intégration, une interface Java est incluse dans la librairie BayesiaLab.jar qui se trouve dans le répertoire d'installation de BayesiaLab. Afin de créer sa propre fonction, l'utilisateur doit "implémenter" cette interface par sa propre classe Java.

Après avoir créer son module et après redémarrage de BayesiaLab, le module est chargé et est disponible dans l'éditeur d'équation. Dans l'exemple suivant la fonction utilisateur Sum permet tout simplement d'additionner deux réels :

Example


Sécurité


Cryptage du XBL

 

Les fichiers de sauvegarde des réseaux bayésiens ont été cryptés afin de garder la confidentialité du contenu si l'on veut distribuer ses réseaux.

Java


Mise en conformité Java 6

 

BayesiaLab a été mis en conformité avec Java 6 et peut donc être exécuter sur une machine virtuelle Java 6. Ceci lui permet de bénéficier des avancées techniques de cette nouvelle version de Java. Cependant la compatibilité avec Java 5 a été conservé pour ceux ne disposant pas de Java 6.