Explication géométrique du résultat dans les arbres de décision - INRAE - Institut national de recherche pour l’agriculture, l’alimentation et l’environnement Accéder directement au contenu
Rapport Année : 2002

Geometric explanation of the result in decision trees

Explication géométrique du résultat dans les arbres de décision

Résumé

This article is devoted to the problem of the explanation of the result given by the decision tree (DT) when it is used as a decision aid system, to classify input data and to provide the output class as a result. At now the end-user can rely mainly on some estimation of the error-rate or on the trace of the classification, that is the path run through the DT. We propose here two new methods to qualify the result given by the DT for each particular case. These methods are based on a gometric study of the inverse image of the different classes (the decision surface). First the tests in the tree that are the most relevant to explain the final class are identifies by the way of sensitivity analysis: the vector of initial data is projected onto the decision surface. The second method relies on a study of the distribution of errors in relation to the decision surface : the distance to this surface is computed for a sample. The distance of a new case is then presented to the end-user in comparaison to the estimation of the distribution of distances.
Cet article s'intéresse au problème de l'explication des résultats fournis par un arbre de décision (AD) quand celui-ci est utilisé en tant que système d'aide à la décision. On s'intéresse au résultat prédit par l'arbre de décision pour chaque vecteur particulier de données d'entrée, c'est à dire à la classe associée à ce vecteur, et on cherche à apporter une information supplémentaire qui permette d'expliquer ou de qualifier le résultat. Deux types principaux d'information sont actuellement disponibles : la trace du classement, c'est à dire le chemin parcouru dans l'arbre, et une estimation du taux d'erreur ou d'un risque associé à un mauvais classement. Nous proposons ici deux nouvelles méthodes de qualification du résultat, basées sur une étude géométrique de la frontière de l'image inverse des différentes classes (la surface de décision). La première méthode consiste à identifier les séparateurs les plus déterminants pour expliquer le résultat, en effectuant une analyse de sensibilité, c'est à dire en projetant les données initiales sur la surface de décision. La deuxième méthode consiste à caractériser la distribution des erreurs relatives à la surface de décision, en calculant la distance à cette surface pour un ensemble de données.

Mots clés

Fichier non déposé

Dates et versions

hal-02581081 , version 1 (14-05-2020)

Identifiants

Citer

I. Alvarez. Explication géométrique du résultat dans les arbres de décision. irstea. 2002, pp.18. ⟨hal-02581081⟩
6 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More