Show Menu
SUJETS×

Options de l'arborescence de décision

Le menu Arborescence de décisions comprend des fonctionnalités permettant de définir le cas d’utilisation positif, les filtres, les options de distribution des feuilles, la matrice de confusion et d’autres options avancées.
Boutons de la barre d’outils Description
Valider Cliquez sur pour exécuter l’algorithme de l’arborescence de décision et afficher la visualisation. Ceci est grisé jusqu’à ce qu’il y ait des entrées.
Reset Efface les entrées et le modèle d’arborescence de décision et réinitialise le processus.
Enregistrer Enregistrez l'arbre de décision. Vous pouvez enregistrer l’arbre de décision dans différents formats :
  • Le langage de balisage prédictif ( PMML ) est un format de fichier XML utilisé par les applications pour décrire et échanger des modèles d’arbre de décision.
  • Texte affichant des colonnes et des lignes simples de valeur true ou false, des pourcentages, du nombre de membres et des valeurs d’entrée.
  • Une dimension avec des branches correspondant aux éléments de résultat prévus.
Options Voir le tableau ci-dessous pour le menu Options.
Menu Options Description
Définir la casse positive Définit la sélection actuelle de l’espace de travail comme cas positif du modèle. Efface le cas si aucune sélection n’existe.
Définir le filtre de population Définit la sélection actuelle de l’espace de travail comme filtre de population du modèle et sera effectuée à partir des visiteurs qui remplissent cette condition. La valeur par défaut est "Tout le monde".
Afficher la description du filtre complexe Affiche la description des filtres définis. Cliquez sur pour afficher les scripts de filtrage pour le filtre Cas positif et Population.
Masquer les noeuds Masque les noeuds avec seulement un faible pourcentage de la population. Cette commande de menu s'affiche uniquement lorsque l'arborescence des décisions est affichée.
Matrice de confusion
Cliquez sur Options > Matrice de confusion pour afficher les valeurs Précision, Rappel, Précision et Score F. Plus près de 100 %, plus le score est élevé.
La matrice de confusion donne quatre valeurs de précision au modèle à l’aide d’une combinaison de valeurs :
  • Positif réel (AP)
  • Positif prédit (PP)
  • Négatif réel (AN)
  • Négatif prédit (PN)
Conseil : Ces chiffres sont obtenus en appliquant le modèle de notation résultant des données de test de 20 % retenues et déjà connues comme la réponse vraie. Si le score est supérieur à 50 %, il est prédit comme un cas positif (qui correspond au filtre défini). Puis, Précision = (TP + TN)/(TP + FP + TN + FN), Rappel = TP / (TP + FN) et Précision = TP / (TP + FP).
Afficher la légende Permet d’activer ou de désactiver une touche de légende dans l’arborescence des décisions.
Cette commande de menu s'affiche uniquement lorsque l'arborescence des décisions est affichée.
Advanced Cliquez pour ouvrir le menu Avancé pour une utilisation approfondie de l'arbre de décision. Voir le tableau ci-dessous pour connaître les options de menu.
Menu Avancé Description
Taille du jeu de formations
Contrôle la taille du jeu de formations utilisé pour la création du modèle. Les plus grands ensembles prennent plus de temps à s'entraîner, les plus petits ensembles prennent moins de temps.
Normalisation des entrées
Permet à l’utilisateur de spécifier s’il doit utiliser la technique Min-Max ou Score Z pour normaliser les entrées dans le modèle.
Facteur de suréchantillonnage de la MOTE Lorsque le cas positif ne se produit pas très souvent (moins de 10 %) dans l’échantillon de formation, SMOTE est utilisé pour fournir des échantillons supplémentaires. Cette option permet à l’utilisateur d’indiquer le nombre d’échantillons supplémentaires à créer à l’aide de SMOTE.
Seuil de distribution de classe feuille Permet de définir le seuil supposé pour une feuille pendant le processus de création de l’arborescence. Par défaut, tous les membres d’un noeud doivent être identiques pour qu’il soit une feuille (avant l’étape d’élagage).