Czasopismo
Tytuł artykułu
Autorzy
Warianty tytułu
Spectral Clustering vs Traditional Clustering Methods
Języki publikacji
Abstrakty
Klasyfikacja spektralna to rozwijające się od końca poprzedniego wieku podejście w analizie skupień. Podejście to, mimo niekiedy niezbyt rozbudowanej podbudowy teoretycznej, daje bardzo dobre wyniki empiryczne zarówno na zbiorach testowych, jak i na rzeczywistych zbiorach danych. W artykule przedstawiono algorytm analizy spektralnej w postaci ogólnej oraz wyniki symulacji obliczeniowych porównujących wyniki klasyfikacji opartej na dekompozycji spektralnej z metodą k-średnich, metodą k-medoidów, metodą Warda i metodą kompletnego połączenia na zbiorach danych o znanej strukturze wygenerowanych z wielowymiarowego rozkładu normalnego, na zbiorach danych z zakłóceniami oraz na zbiorach danych otrzymanych z przetworzenia rzeczywistych obrazów. (abstrakt oryginalny)
Spectral clustering has been known since the end of the 20th century and is developing quite fest. Despite the lack of a strong theoretical basis, this method gives very good empirical results on artificial and real data. In this paper, algorithm (in general form) of spectral clustering has been described along with the results of empirical simulations comparing spectral clustering with k-means, partition around medoids, Ward and complete link „traditional" methods. The simulations have been made on datasets with known cluster structure generated from multivariate normal distribution, on datasets with noisy variables and on processed real images data. (original abstract)
Rocznik
Tom
Strony
21--34
Opis fizyczny
Twórcy
autor
- Uniwersytet Ekonomiczny we Wrocławiu
Bibliografia
- Baker F.B., Hubert L.J., Measuring the power of hierarchical cluster analysis, „Journal of the American Statistical Association" 1975, no. 70, s. 31-38.
- Caliński R.B., Harabasz J., A dendrite method for cluster analysis, „Communications in Statistics"1974, vol. 3, s. 1-27.
- Climcscu-Haulica A., How to choose the number of clusters. The Cramer Multiplicity Solution, [w:] H.H.-J. Lenz, R. Decker (red.), Advances in Data Analysis, Berlin 2006, s. 15-23.
- Cristianini N., Kandola J., Spectra! Methods for Clustering, Neural Information Processing Symposium, http://www.nips.cc/NIPS2001/papcrs/psgz/AA35.ps.gz, 2001.
- Davies D.L., Bouldin D.W., A cluster separation measure, „IEEE Transactions on Pattern Analysis and Machine Intelligence" 1979, vol. 1, no. 2, s. 224-227.
- Everitt B.S., Landau S., Leese M., Cluster Analysis, Edward Arnold, London 2001.
- Gatnar E., Walesiak M. (red.), Metody statystycznej analizy wielowymiarowej w badaniach marketingowych, AE, Wrocław 2004.
- Gordon A.D., Classification, Chapman and Hall/CRC, London 1999.
- Hartigan J.A., Clustering Algorithms, Wiley, New York, London, Sydney, Toronto 1975.
- Hubert L.J., Approximate evaluation techniąue for the single-link and complete-link hierarchical clustering procedures, „Journal of the American Statistical Association" 1974, vol. 69, no. 347, s. 698-704.
- Hubert L.J., Arabie P., Comparing partitions, „Journal of Classification" 1985, no. 1, s. 193-218. Hubert L.J., Levine J.R., Evaluating object set partitions: free sort analysis and some generalizations,
- „Journal of Verbal Learning and Verbal Behaviour" 1976, vol. 15, s. 549-570.
- Kaufman L., Rousseeuw P.J., Finding Groups in Data: an Introduction to Cluster Analysis, Wiley, New York 1990.
- Krzanowski W.J., Lai Y.T., A criterion of determining the number of groups in a data set using sumof sąuares clustering, „Biomctrics" 1985, vol. 44, s. 23-34.
- von Luxburg U., A Tutorial on Spectra/ Clustering, Max Planck Institute for Biological Cybernetics, Technical Report TR-149, 2006.
- Milligan G.W., Clustering Validation: Results and Implications for Applied Analyses, [w:] P. Arabie,
- L.J. Hubert, G. de Soete (red.), Clustering and Classification, World Scientific, Singapore 1996, s 341-375.
- Milligan G.W., Cooper M.C., An examination of procedures for determining the number of clusters ina data set, „Psychometrika" 1985, no. 2, s. 159-179.
- Ng A., Jordan I., Weiss Y., On Spectral Clustering: Analysis and an Algorithm, Neural Information
- Processing Symposium, (http:/Avww.nips.cc/NIPS2001/papers/psgz/AA35.ps.gz), 2001. Rousseeuw P.J., Silhouettes: a Graphical Aid to the Interpretation and Validation of Cluster Analysis,
- „Journal of Computational and Applied Mathematics" 1987, no. 20, s. 53-65.
- Tibshirani R., Walther G., Hastie T., Estimating the number of clusters in a data set via the gap statistic, „Journal of the Royal Statistical Society" 2001, ser. B, vol. 63, part 2, s. 411-423.
- Tibshirani R., Walther G., Cluster Validation by Prediction Strength, „Journal of Computational andGraphical Statistics" 2005, Septembcr, no. 3.
- Walesiak M., Statystyczna analiza wielowymiarowa w badaniach marketingowych, [w:] Prace Naukowe Akademii Ekonomicznej we Wrocławiu nr 654, Seria: Monografie i Opracowania nr101, AE, Wrocław 1993.
- Walesiak M., Problemy decyzyjne w procesie klasyfikacji zbioru obiektów, [w:] Prace Naukowe Akademii Ekonomicznej we Wrocławiu nr 1010, AE, Wrocław 2004, s. 52-71.
- Walcsiak M., Dudek A., ClusterSim, pakiet środowiska statystycznego R, http://wgrit.ae.jgora.pl/kcii/ clusterSim oraz http://cran.rprojcct.org/wcb/packagcs/clusterSim/index.html, 2008.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000164164060