Czasopismo
Tytuł artykułu
Autorzy
Warianty tytułu
Variable clustering in exploration data processes
Języki publikacji
Abstrakty
Grupowanie obiektów, znane pod nazwą analizy skupień, jest jedną z najczęściej stosowanych metod eksploracyjnych Data Mining. Używane są metody hierarchicznego, jak i niehierarchicznego skupiania, wykorzystujące różne algorytmy i wersje metody, dające w wyniku podział obiektów rozłączny i zupełny, jak również wersja rozmyta, oparta na zastosowaniu teorii zbiorów rozmytych. Znacznie rzadziej, zarówno w opisach literaturowych, jak i w praktyce, spotyka się zastosowania metod grupowania w odniesieniu do zmiennych, ze względu na które są charakteryzowane obiekty. Nie odzwierciedla to faktu, że grupowanie zmiennych jest bardzo przydatne w analizach danych zawierających dużą liczbę zmiennych. W przedstawianym artykule chcielibyśmy zaprezentować niektóre możliwości, jakie może dać przeprowadzenie skupiania zmiennych. (fragment tekstu)
Variable clustering is a useful tool for data reduction. It removes collinearity, decreases variable redundancy and helps to interpret results of an analysis. In the paper, Variable Clustering Node of SAS Enterprise Miner is described. An example of clustering of households expenditures on food, alcohol and tobacco is presented. (original abstract)
Twórcy
Bibliografia
- Anderberg M.R. 1973. Cluster Analysis for Applications, Academic Press Inc., New York.
- Budżety gospodarstw domowych w 2007 r., Informacje i opracowania statystyczne, GUS, Warszawa 2008.
- Reference Help - Enterprise Miner 5.3., Variable Clustering Node, SAS Institute Inc., Cary, NC, USA 2007.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171327711