Czasopismo
Tytuł artykułu
Autorzy
Warianty tytułu
Analytical Procedures for Determining the Number of Clusters in Fuzzy Data Sets
Języki publikacji
Abstrakty
W niniejszej pracy zaprezentowane zostaną wybrane wskaźniki liczby skupień nazywane też wskaźnikami jakości grupowania (cluster validity index, duster separation index). Wskaźniki te mogą być szczególnie użyteczne w analizie dwuwymiarowych map SOM, a także innych dwuwymiarowych, rozmytych zbiorów danych. Dokonana zostanie ich ocena oparta na wynikach przeprowadzonych badań eksperymentalnych. (fragment tekstu)
Several clustering techniques have been proposed for the analysis of fuzzy data sets. Cluster validity indices represent useful tools to support such a task. In this paper three validation indices were applied to fourteen data sets. The resultant optimal clusters have been found to be stable for the different validity indices used, viz. Bezdek's Partition Coefficient (PC), Classification Entropy (CE) and Separation Index (S). It was shown that these methods might support the prediction of the optimal cluster partitioning for those data sets but the determination of the optimal number of clusters is an open problem. Two indices (PC and CE) were called into question their usefulness. Index S was characterized by relatively not large errors and significant effectiveness. (original abstract)
Słowa kluczowe
Rocznik
Tom
Strony
159--167
Opis fizyczny
Twórcy
Bibliografia
- Bezdek J.C. (1974), Cluster Validity with Fuzzy Sets, "J. Cybernet." nr 3, s. 58-72.
- Bezdek J.C., Ehrlich R., Full W. (1984), FCM: Fuzzy С-Means Algorithm, Computers and Geoscience.
- Jurkiewicz T., Najman K. (2003), Bootstrapowa analiza własności modyfikowanego estymatora syntetycznego, [w:] Metoda reprezentacyjna w badaniach ekonomiczno-społecznych, red. J. Wywiał, część II, AE, Katowice, s. 15-26.
- Kim D.W., Lee K., Lee D. (2004), On Cluster Validity Indem for Estimation of the Optima Numer of Fuzzy Clusters, "Pattern Recognition" nr 37, s. 2009-2025.
- Milligan G.W., Cooper M.C. (1985), An Examination of Procedures for Determining the Number of Clusters in Data Set, "Psychometrika" nr 50(2), s. 159-179.
- Najman K., Najman K. (2002), Zastosowanie sieci neuronowej typu SOM do wyboru najatrakcyjniejszych spółek na WGPW, Prace Naukowe AE we Wrocławiu", nr 952, AE, Wrocław, s. 493-499.
- Najman K., Najman K. (2002), Zastosowanie sieci neuronowej typu SOM do wyboru najatrakcyjniejszych spółek na WGPW na bazie wskaźników analizy technicznej, Rynek Kapitałowy - Skuteczne Inwestowanie, Międzyzdroje, t. II, Wydawnictwo Uniwersytetu Szczecińskiego, s. 403-417.
- Najman K., Najman K. (2003), Próba zastosowania sieci neuronowej typu SOM w badaniu przestrzennego zróżnicowania powiatów w Polsce, "Wiadomości Statystyczne" nr 4, s. 72-84.
- Najman K., Najman K. (2005), Analityczne metody ustalania liczby skupień, Klasyfikacja i analiza danych - teoria i zastosowania, Taksonomia 12, AE, Wrocław, s. 265-273.
- Sun H., Wang S., Jiang Q. (2004), FCM-Based Model Selection Algorithms for Determining the Number of Clusters, "Pattern Recognition" nr 37, s. 2027-2037.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171558348