Czasopismo
Tytuł artykułu
Autorzy
Warianty tytułu
The Proposal of Visualization of Classification Results Supporting Class Description
Języki publikacji
Abstrakty
Metoda wizualizacji wyników klasyfikacji przedstawiona w artykule bazuje na procedurze składającej się z dwóch etapów: 1. W pierwszym etapie dla każdej klasy osobno wyznaczany jest ranking zmiennych ze względu na ich moc dyskryminującą - zdolność do odróżniania obiektów danej klasy od wszystkich innych obserwacji. Przy ocenie siły wpływu poszczególnych zmiennych objaśniających na wynik klasyfikacji wykorzystuje się jedną z metod symulacyjnego przeszukiwania podzbiorów zmiennych - metodę eliminacji. 2. W drugim etapie otrzymane informacje (ranking istotności zmiennych) są w prosty sposób kodowane i przedstawiane w sposób graficzny, umożliwiając badaczowi przeprowadzenie profilowania klas. Zaprezentowane podejście w prosty i intuicyjny sposób łączy wyniki klasyfikacji obiektów z klasyfikacją zmiennych objaśniających. (fragment tekstu)
After building the classification model, at the stage of the class description we try to extract knowledge from the model. We search for the description of classification rules, the natural language. The paper presents the simple algorithm for building the ranking of predictor variables based on their descriptive power (for every class separately) and uses boxplots to enable interpretation and give some insight. The procedure is universal and can be applied to classic or data mining methods. SVMs, Random Forest, Neural Network and k-Nearest Neighbours were used for illustration with R software. (original abstract)
Rocznik
Strony
65--74
Opis fizyczny
Twórcy
autor
- Akademia Ekonomiczna im. Karola Adamieckiego w Katowicach
autor
- Akademia Ekonomiczna im. Karola Adamieckiego w Katowicach
Bibliografia
- Guyon I., Gunn S., Nikravesh M., Zadeh L. (red.), Feature Extraction. Foundations and Applications, Springer, 2006.
- Hastie T., Tibshirani R., Friedman J., The Elements of Statistical Learning, Springer Verlag, N.Y 2001.
- Rakotomamonjy A., Variable Selection Using SVM-based Criteria, "Journal of Machine Learning Research" 2003 nr 3, s. 1357-1370.
- Trzęsiok M., Metoda wektorów nośnych na tle innych metod wielowymiarowej analizy danych, [w:] Taksonomia 13, Klasyfikacja i analiza danych - teoria i zastosowania, K. Jajuga, M. Walesiak (red.), AE, Wrocław 2006, s. 536-542.
- Walesiak M., Gatnar E. (red.), Statystyczna analiza danych z wykorzystaniem programu R, PWN, Warszawa 2009.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000170594961