PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2009 | 23 | nr 37 Zastosowania metod ilościowych | 21--34
Tytuł artykułu

Klasyfikacja spektralna a tradycyjne metody analizy skupień

Autorzy
Warianty tytułu
Spectral Clustering vs Traditional Clustering Methods
Języki publikacji
PL
Abstrakty
Klasyfikacja spektralna to rozwijające się od końca poprzedniego wieku podejście w analizie skupień. Podejście to, mimo niekiedy niezbyt rozbudowanej podbudowy teoretycznej, daje bardzo dobre wyniki empiryczne zarówno na zbiorach testowych, jak i na rzeczywistych zbiorach danych. W artykule przedstawiono algorytm analizy spektralnej w postaci ogólnej oraz wyniki symulacji obliczeniowych porównujących wyniki klasyfikacji opartej na dekompozycji spektralnej z metodą k-średnich, metodą k-medoidów, metodą Warda i metodą kompletnego połączenia na zbiorach danych o znanej strukturze wygenerowanych z wielowymiarowego rozkładu normalnego, na zbiorach danych z zakłóceniami oraz na zbiorach danych otrzymanych z przetworzenia rzeczywistych obrazów. (abstrakt oryginalny)
EN
Spectral clustering has been known since the end of the 20th century and is developing quite fest. Despite the lack of a strong theoretical basis, this method gives very good empirical results on artificial and real data. In this paper, algorithm (in general form) of spectral clustering has been described along with the results of empirical simulations comparing spectral clustering with k-means, partition around medoids, Ward and complete link „traditional" methods. The simulations have been made on datasets with known cluster structure generated from multivariate normal distribution, on datasets with noisy variables and on processed real images data. (original abstract)
Twórcy
  • Uniwersytet Ekonomiczny we Wrocławiu
Bibliografia
  • Baker F.B., Hubert L.J., Measuring the power of hierarchical cluster analysis, „Journal of the American Statistical Association" 1975, no. 70, s. 31-38.
  • Caliński R.B., Harabasz J., A dendrite method for cluster analysis, „Communications in Statistics"1974, vol. 3, s. 1-27.
  • Climcscu-Haulica A., How to choose the number of clusters. The Cramer Multiplicity Solution, [w:] H.H.-J. Lenz, R. Decker (red.), Advances in Data Analysis, Berlin 2006, s. 15-23.
  • Cristianini N., Kandola J., Spectra! Methods for Clustering, Neural Information Processing Symposium, http://www.nips.cc/NIPS2001/papcrs/psgz/AA35.ps.gz, 2001.
  • Davies D.L., Bouldin D.W., A cluster separation measure, „IEEE Transactions on Pattern Analysis and Machine Intelligence" 1979, vol. 1, no. 2, s. 224-227.
  • Everitt B.S., Landau S., Leese M., Cluster Analysis, Edward Arnold, London 2001.
  • Gatnar E., Walesiak M. (red.), Metody statystycznej analizy wielowymiarowej w badaniach marketingowych, AE, Wrocław 2004.
  • Gordon A.D., Classification, Chapman and Hall/CRC, London 1999.
  • Hartigan J.A., Clustering Algorithms, Wiley, New York, London, Sydney, Toronto 1975.
  • Hubert L.J., Approximate evaluation techniąue for the single-link and complete-link hierarchical clustering procedures, „Journal of the American Statistical Association" 1974, vol. 69, no. 347, s. 698-704.
  • Hubert L.J., Arabie P., Comparing partitions, „Journal of Classification" 1985, no. 1, s. 193-218. Hubert L.J., Levine J.R., Evaluating object set partitions: free sort analysis and some generalizations,
  • „Journal of Verbal Learning and Verbal Behaviour" 1976, vol. 15, s. 549-570.
  • Kaufman L., Rousseeuw P.J., Finding Groups in Data: an Introduction to Cluster Analysis, Wiley, New York 1990.
  • Krzanowski W.J., Lai Y.T., A criterion of determining the number of groups in a data set using sumof sąuares clustering, „Biomctrics" 1985, vol. 44, s. 23-34.
  • von Luxburg U., A Tutorial on Spectra/ Clustering, Max Planck Institute for Biological Cybernetics, Technical Report TR-149, 2006.
  • Milligan G.W., Clustering Validation: Results and Implications for Applied Analyses, [w:] P. Arabie,
  • L.J. Hubert, G. de Soete (red.), Clustering and Classification, World Scientific, Singapore 1996, s 341-375.
  • Milligan G.W., Cooper M.C., An examination of procedures for determining the number of clusters ina data set, „Psychometrika" 1985, no. 2, s. 159-179.
  • Ng A., Jordan I., Weiss Y., On Spectral Clustering: Analysis and an Algorithm, Neural Information
  • Processing Symposium, (http:/Avww.nips.cc/NIPS2001/papers/psgz/AA35.ps.gz), 2001. Rousseeuw P.J., Silhouettes: a Graphical Aid to the Interpretation and Validation of Cluster Analysis,
  • „Journal of Computational and Applied Mathematics" 1987, no. 20, s. 53-65.
  • Tibshirani R., Walther G., Hastie T., Estimating the number of clusters in a data set via the gap statistic, „Journal of the Royal Statistical Society" 2001, ser. B, vol. 63, part 2, s. 411-423.
  • Tibshirani R., Walther G., Cluster Validation by Prediction Strength, „Journal of Computational andGraphical Statistics" 2005, Septembcr, no. 3.
  • Walesiak M., Statystyczna analiza wielowymiarowa w badaniach marketingowych, [w:] Prace Naukowe Akademii Ekonomicznej we Wrocławiu nr 654, Seria: Monografie i Opracowania nr101, AE, Wrocław 1993.
  • Walesiak M., Problemy decyzyjne w procesie klasyfikacji zbioru obiektów, [w:] Prace Naukowe Akademii Ekonomicznej we Wrocławiu nr 1010, AE, Wrocław 2004, s. 52-71.
  • Walcsiak M., Dudek A., ClusterSim, pakiet środowiska statystycznego R, http://wgrit.ae.jgora.pl/kcii/ clusterSim oraz http://cran.rprojcct.org/wcb/packagcs/clusterSim/index.html, 2008.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000164164060

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.