PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2015 | nr 384 Taksonomia 24 Klasyfikacja i analiza danych - teoria i zastosowania | 25--32
Tytuł artykułu

Symulacyjne badanie wykorzystania entropii do badania jakości klasyfikacji

Treść / Zawartość
Warianty tytułu
Simulation Study of the Use of Entropy to Validation of Clustering
Języki publikacji
PL
Abstrakty
Celem prezentowanej pracy było zweryfikowanie, czy proponowany wskaźnik jakości klasyfikacji wykorzystujący entropię Renyi'ego może być stosowany do określenia liczby podgrup. Badanie przeprowadzono na danych sztucznie wygenerowanych. Zastosowano algorytm aglomeracji Warda, klasyfikacji k-średnich oraz klasyfikacji spektralnej. Na podstawie wybranych czterech indeksów zweryfikowano poprawność wykrywania struktury grupowej. Badano tylko liczbę grup, a nie przynależność poszczególnych elementów do grupy. Otrzymane wyniki potwierdzają skuteczność proponowanego wskaźnika w problemie dotyczącym weryfikacji liczby grup(abstrakt oryginalny)
EN
The aim of this paper is to present a quality index classification using Renyi entropy against known quality indicators grouping of multidimensional time series. The study was conducted on artificially generated data and empirical data. The division into groups was made by using Ward's agglomeration algorithm, k-means method's and spectral clustering. The results were verified using the selected indices of clustering validation(original abstract)
Słowa kluczowe
Twórcy
  • AGH Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie
  • AGH Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie
Bibliografia
  • Baarsch J., Celebi M.C., 2012, Investigation of Internal Validity Measures for K-Means Clustering, IMECS 2012, Hong Kong.
  • Basiura B., Czapkiewicz A., 2014, Badanie jakości klasyfikacji szeregów czasowych, PN 327 Taksonomia 22, Klasyfikacja i analiza danych - teoria i zastosowania, Jajuga K., Walesiak M. (red.), Uniwersytet Ekonomiczny we Wrocławiu.
  • Davies D., Bouldin D., 1979, A cluster separation measure, IEEE Transactions on Pattern Analysis and Machine Intelligence 1(2): 224-227.
  • Calinski R.B., Harabasz J., 1974, A dendrite method for cluster analysis, Communications in Statistics - Theory and Methods 3(1): 1-27.
  • Halkidi M., Yannis B., Vazirgiannis M., 2001, On clustering validation techniques, Journal of Intelligent Information Systems, 17:2/3, 107-145.
  • Jenssen R., Hild K.E., Erdogmus D., Principe J.C., Eltoft T., 2003, Clusterin using renyi's entropy, Neural Networks, Proceedings of the International Joint Conference on (Volume:1).
  • Liang J., Zhao X., Li D., Cao F., Dang C., 2011, Determining the number of clusters using information entropy for Mixed Data, Patter Recognition, v. 45, 2251-2265.
  • Milligan G., Glenn W., 1981, A Monte Carlo study of thirty internal criterion measures for cluster analysis, Psychometrika 46(2): 187-199.
  • Rendón E., Abundez I., Arizmendi A., Quiroz E.M., 2011, Internal versus external cluster validation indexes, Intenational Journal of Computers and Communications, no. 1, vol. 5.
  • Rényi A., 1961, On measures of information and entropy, Proceedings of the fourth Berkeley Symposium on Mathematics, Statistics and Probability 1960, pp. 547-561.
  • Rousseeuw P.J., 1987 Silhouettes: A , Graphic aid to the interpretation and validation of cluster analysis, Journal of Computational and Applied Mathematics 20(1): 53-65.
  • Walesiak M., Gatnar E., 2009, Statystyczna analiza danych z wykorzystaniem programu R, PWN, Warszawa.
  • Walesiak M., 2013, Zagadnienie doboru liczby klas w klasyfikacji spektralnej, Taksonomia 20 - Klasyfikacja i analiza danych - teoria i zastosowania, UE, Wrocław.
  • Walesiak M., Dudek M., 2012, Package 'clusterSim' in R project, http://keii.ue.wroc.pl/clusterSim/index.html.
  • Wędrowska E., 2011, Wykorzystanie entropii Shanona i jej uogólnień do badania rozkładu prawdopodobieństwa zmiennej losowej dyskretnej, Przegląd Statystyczny, RLVII, zeszyt 4.
  • R Development Core Team (2005). R: A language and environment for statistical computing, reference index version 2.12.2 (2011-02-25) R Foundation for Statistical Computing, Vienna, Austria.
  • ISBN 3-900051-07-0, URL http://www.R-project.org.
  • Kovács F., Legány C., & Babos A., 2005, Cluster validity measurement techniques. Proceedings of the 6th Iternational Symposium of Hungarian Researchers on Computational Intelligence, Budapest, Nov. 2005, 18-19.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171379057

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.