Czasopismo
Tytuł artykułu
Autorzy
Warianty tytułu
Investigating the Efficiency of Modified Agglomerative Methods on Real World Data Sets
Języki publikacji
Abstrakty
Niniejszy artykuł zawiera wyniki badania efektywności zmodyfikowanych metod aglomeracyjnych służących do grupowania obserwacji. Ideą modyfikacji algorytmów aglomeracyjnych jest wprowadzenie do stosowanego kryterium dodatkowego pomiaru mającego na celu łączenie skupień z uwzględnieniem lokalnej gęstości rozkładu obserwacji, tj. zwiększenie znaczenia obszarów o dużej gęstości obserwacji przy ustaleniu kolejności łączenia istniejących skupień. W dalszym ciągu artykułu znajduje się dokładne sformułowanie modyfikacji kilku wybranych algorytmów aglomeracyjnych, omówienie metody ustalania liczby skupień, na jaką należy podzielić zbiór danych metod oceny jakości podziału oraz wyniki badania kilku zabiorów danych ze świata realnego. (fragment tekstu)
In the paper, the efficiency of agglomerative clustering algorithms is investigated with a special focus on the author's own modifications. The following clustering algorithms are examined: single link, complete link, group average link and centroid link. The idea of the modifications is to stress the local distribution of observations together with clustering based on the dissimilarity matrix. The quality of clustering is assessed by means of the silhouette indices. The results prove that the author's modifications almost always improve the standard methods. (original abstract)
Rocznik
Tom
Strony
462--469
Opis fizyczny
Twórcy
autor
- Uniwersytet Łódzki
Bibliografia
- Gordon A.D. (1999), Classification, Chapman & Hall, London, New York, Washington.
- Ripley B.D. (1996), Pattern Recognition and Neural Networks, Cambridge University Press, Cambridge
- Sugar C.A., James G.M. (2003), Finding the Number of Clusters in a Dataset, An Information- -theoretic Approach, „JASA", vol. 98.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000169078671