Czasopismo
Tytuł artykułu
Autorzy
Warianty tytułu
Using of the Kolmogorov-Smirnоv Criterion While Building Classification Tree for Set of Symbolic Objects
Języki publikacji
Abstrakty
Zaprezentowane w artykule kryterium Kołmogorowa-Smirnowa to narzędzie, na podstawie którego dokonywany jest wybór sposobu podziału zbioru obiektów symbolicznych w węzłach drzewa. Zaletą tego kryterium jest fakt, iż w przeciwieństwie do popularnych miar jakości podziału uwzględnia ono wiedzę o uporządkowaniu zbioru wartości cechy. Niestety, miara ta nie jest niezależna od charakteru zmiennych. Wobec tego otwarty staje się problem rozważenia stosowalności tej miary w odniesieniu do innych typów danych. (fragment tekstu)
If we are interested in dividing symbolic objects' into groups, as regards to specific variable values, it would be more comfortable to present this process as a decision tree. To build decision tree, we need a criterion in order to split the symbolic objects' set in a nodes. In this article the Kolmogorov-Smimov criterion is presented, as a splitting criterion of symbolic objects' set. For this criterion, the values taken by the explanatory variables have to be ordered. We considered different possible orders of interval and histogram variables. At the end we show an example to illustrate this approach. (original abstract)
Rocznik
Tom
Strony
160--168
Opis fizyczny
Twórcy
autor
- Akademia Ekonomiczna im. Karola Adamieckiego w Katowicach
Bibliografia
- Diday E. (2002), An Introduction to Symbolic Data Analysis and the SODAS Software, "The Electronic Journal of Symbolic Data Analysis".
- Friedman J. H., A Recursive Partitioning Decision Rule for Non Parametric Classification, "IEEE Transactions on Computers" C-26, s. 404-408.
- Gatnar E. (1998), Symboliczne metody klasyfikacji danych, PWN, Warszawa, s. 163-176.
- Mballo C., Diday E. (2005), Decision Trees on Interval Valued Variables, "The Electronic Journal of Symbolic Data Analysis" t. 3, nr 1, czerwiec.
- Mballo C., Diday E. (2004), Kolmogorov-Smimov for Decision Tree on Interval and Histogram Variables, [w:] D. Banks, L. House, F.R. McMorris, P. Arabie, W. Gaul (red.), Classification, Clustering and Data Mining Applications, Springer, Chicago.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171478719