PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2006 | 13 | nr 1126 Klasyfikacja i analiza danych - teoria i zastosowania | 159--167
Tytuł artykułu

Analityczne metody ustalania liczby skupień w rozmytych zbiorach danych

Warianty tytułu
Analytical Procedures for Determining the Number of Clusters in Fuzzy Data Sets
Języki publikacji
PL
Abstrakty
W niniejszej pracy zaprezentowane zostaną wybrane wskaźniki liczby skupień nazywane też wskaźnikami jakości grupowania (cluster validity index, duster separation index). Wskaźniki te mogą być szczególnie użyteczne w analizie dwuwymiarowych map SOM, a także innych dwuwymiarowych, rozmytych zbiorów danych. Dokonana zostanie ich ocena oparta na wynikach przeprowadzonych badań eksperymentalnych. (fragment tekstu)
EN
Several clustering techniques have been proposed for the analysis of fuzzy data sets. Cluster validity indices represent useful tools to support such a task. In this paper three validation indices were applied to fourteen data sets. The resultant optimal clusters have been found to be stable for the different validity indices used, viz. Bezdek's Partition Coefficient (PC), Classification Entropy (CE) and Separation Index (S). It was shown that these methods might support the prediction of the optimal cluster partitioning for those data sets but the determination of the optimal number of clusters is an open problem. Two indices (PC and CE) were called into question their usefulness. Index S was characterized by relatively not large errors and significant effectiveness. (original abstract)
Słowa kluczowe
Twórcy
  • Uniwersytet Gdański
  • Uniwersytet Gdański
Bibliografia
  • Bezdek J.C. (1974), Cluster Validity with Fuzzy Sets, "J. Cybernet." nr 3, s. 58-72.
  • Bezdek J.C., Ehrlich R., Full W. (1984), FCM: Fuzzy С-Means Algorithm, Computers and Geoscience.
  • Jurkiewicz T., Najman K. (2003), Bootstrapowa analiza własności modyfikowanego estymatora syntetycznego, [w:] Metoda reprezentacyjna w badaniach ekonomiczno-społecznych, red. J. Wywiał, część II, AE, Katowice, s. 15-26.
  • Kim D.W., Lee K., Lee D. (2004), On Cluster Validity Indem for Estimation of the Optima Numer of Fuzzy Clusters, "Pattern Recognition" nr 37, s. 2009-2025.
  • Milligan G.W., Cooper M.C. (1985), An Examination of Procedures for Determining the Number of Clusters in Data Set, "Psychometrika" nr 50(2), s. 159-179.
  • Najman K., Najman K. (2002), Zastosowanie sieci neuronowej typu SOM do wyboru najatrakcyjniejszych spółek na WGPW, Prace Naukowe AE we Wrocławiu", nr 952, AE, Wrocław, s. 493-499.
  • Najman K., Najman K. (2002), Zastosowanie sieci neuronowej typu SOM do wyboru najatrakcyjniejszych spółek na WGPW na bazie wskaźników analizy technicznej, Rynek Kapitałowy - Skuteczne Inwestowanie, Międzyzdroje, t. II, Wydawnictwo Uniwersytetu Szczecińskiego, s. 403-417.
  • Najman K., Najman K. (2003), Próba zastosowania sieci neuronowej typu SOM w badaniu przestrzennego zróżnicowania powiatów w Polsce, "Wiadomości Statystyczne" nr 4, s. 72-84.
  • Najman K., Najman K. (2005), Analityczne metody ustalania liczby skupień, Klasyfikacja i analiza danych - teoria i zastosowania, Taksonomia 12, AE, Wrocław, s. 265-273.
  • Sun H., Wang S., Jiang Q. (2004), FCM-Based Model Selection Algorithms for Determining the Number of Clusters, "Pattern Recognition" nr 37, s. 2027-2037.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171558348

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.