PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2013 | 20 | nr 278 Klasyfikacja i analiza danych - teoria i zastosowania | 93--100
Tytuł artykułu

Modyfikacja metody HINoV selekcji zmiennych w analizie skupień

Warianty tytułu
Modification of the HINoV Method of Selecting Variables in Cluster Analysis
Języki publikacji
PL
Abstrakty
Metoda HINoV selekcji zmiennych w analizie skupień jest znana od roku 1999. Oryginalna metoda HINoV jest zupełnie nieodporna na występowanie wśród zmiennych zanieczyszczających strukturę skupień zmiennych skorelowanych jednomodalnych lub równomiernych. Wadę tę próbowano wyeliminować w modyfikacji VS-KM. Częściowo się to udało. W artykule zaproponowana jest prosta modyfikacja polegająca na tym, by dla każdej liczby skupień rozważanej w procedurze replikacji zbadać stabilność podziału zbioru dla obu porównywanych podzbiorów zmiennych (rozłącznych), z których jeden trzeba wybrać. Modyfikacja oceniona jest w obszernym eksperymencie symulacyjnym na 8100 zbiorach danych ze strukturami skupień wygenerowanymi w postaci mieszanin rozkładów normalnych.(abstrakt oryginalny)
EN
The HINoV metod of variable selection has been known since 1999. The original method is not resistant to the existence of correlated variables among the noisy variables. This drawback was partially eliminated in the VS-KM modification of HINoV. In the article a modification of HINoV is proposed, consisting in the assessment of stability of the data division for each number of clusters and for both of the compared sets of variables. In the simplest variant one has to choose the subset whose stability criterion is highest. A new way of dividing the set of variables into two subsets is also proposed. The stability criterion is based on repeated drawing of roughly half of the data and comparing the divisions received with the help of the k-means. The modification is assessed in a broad simulation experiment comprising 8100 data sets with cluster structures generated in the form of the mixtures of normal distributions.(original abstract)
Słowa kluczowe
Twórcy
  • Uniwersytet Łódzki
Bibliografia
  • Carmone F.J. Jr., Kara A., Maxwell S. (1999), HINoV: a new model to improve market segment definition by identifying noisy variables , "Journal of Marketing Research", vol. 36.
  • Dy J., Brodley C. (2000), Feature subset selection and order identification for unsupervised learning, Proc. 17th International Conf. on Machine Learning.
  • Friedman J., Meulman J. (2004), Clustering objects on subsets of attributes, "Journal of the Royal Statistical Society", Series B 66.
  • Gatnar E., Walesiak M. (red.) (2004), Metody statystycznej analizy wielowymiarowej w badaniach marketingowych, Wydawnictwo AE we Wrocławiu.
  • Law M., Jain A., Figueiredo M. (2003), Feature Selection in Mixture-Based Clustering , IEEE Transactions on Pattren Analysis and Machine Inteligence.
  • Montanari A., Lizzani L. (2001), A projection pursuit approach to variable selection, "Computational Statistics and Data Analysis", vol. 35(4).
  • Raftery A.E., Dean N. (2006), Variable selection for model based clustering, JASA 101.
  • Steinley D., Brusco M. (2007), A new variable weighting and selection procedure for k-means cluster analysis, "Psychometrika".
  • Steinley D., Brusco M. (2008), Selection of variables in cluster analysis: an empirical comparison of eight procedures, "Psychometrika" 73.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171250583

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.