Metoda taksonomii wrocławskiej w klasyfikacji obiektów symbolicznych

Dudek, Andrzej

Artykuł - szczegóły

Czasopismo

Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Taksonomia

2007 | 14 | nr 1169 Klasyfikacja i analiza danych - teoria i zastosowania | 169--177

Tytuł artykułu

Metoda taksonomii wrocławskiej w klasyfikacji obiektów symbolicznych

Autorzy

Andrzej Dudek

Warianty tytułu

Dendrite Clustering in Classification of Symbolic Objects

Języki publikacji

Abstrakty

Metoda taksonomii wrocławskiej, dobrze znana w wielowymiarowej analizie statystycznej, jest obecnie trochę zapomniana, ponieważ jest podobna do metody najbliższego sąsiada klasyfikacji hierarchicznej. Okazuje się jednak, iż metoda ta może zostać z powodzeniem zastosowana w odniesieniu do danych symbolicznych (dla tych danych ze względu na specyfikę miar odległości nie pojawia się problem tożsamości algorytmu z metodą najbliższego sąsiada). Artykuł przedstawia zastosowanie metody taksonomii wrocławskiej do klasyfikacji obiektów symbolicznych. W kolejnych częściach artykułu opisane są: pojęcie obiektu i zmiennej symbolicznej, miary podobieństwa obiektów symbolicznych, kroki metody taksonomii wrocławskiej, algorytmu klasyfikacji i mierniki jakości klasyfikacji dla danych symbolicznych, a także dwa eksperymenty pozwalające na ocenienie przydatności metody taksonomii wrocławskiej w klasyfikacji obiektów symbolicznych. (fragment tekstu)

Dendrite clustering is used in multivariate statistical analysis for over fifty year. Despite it has been designed for "traditional" data, after minor modifications it can be adapted to symbolic data e.g. data representing: single quantitative values, categorical values, intervals, multi-valued variables, multi-valued variables with weights. In this paper usage of dendrite method for symbolic data is described, Nine clustering algorithms: Ward, single link, complete link, average link, Mcquitty, median and centroid hierarchical clustering methods, partitioning around medoids, dynamic clustering for symbolic objects are compared with dendrite method and situations where this method gives better results are pointed. (original abstract)

Słowa kluczowe

Klasyfikacja obiektów Taksonomia wrocławska

Classification of objects Wroclaw taxonomy

Czasopismo

Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Taksonomia

Rocznik

2007

Tom

Numer

nr 1169 Klasyfikacja i analiza danych - teoria i zastosowania

Strony

169--177

Opis fizyczny

Twórcy

autor

Andrzej Dudek

Akademia Ekonomiczna we Wrocławiu

Bibliografia

Baker F.B., Hubert L.J. (1975), Measuring the Power of Hierarchical Cluster Analysis, ,Journal of the American Statistical Association" vol. 70, nr 349, s. 31-38.
Bock H.H., Diday E. (red.) (2000), Analysis of Symbolic Data. Explanatory Methods for Extracting Statistical Information from Complex Data, Heidelberg-Springer-Verlag.
Chavent M., De Carvalho F.A.T, Verde R., Lechevallier Y. (2003), Trois nouvelle methodes de classification automatique de donnees symboliques de type intervals, "Revue de Statistique Appliquee" LI 4, s. 5-29.
de Carvalho F.A.T., Souza R. (1998), Statistical Proximity Functions of Boolean Symbolic Objects Based on Histograms, Advances in Data Science and Classification, Heidelberg-Springer-Verlag, 391-396.
Diday E. (2002), An Introduction to Symbolic Data Analysis and the SODAS Software, J.S.D.A., International E-Journal.
Dudek A. (2005), Internal Cluster Quality Indexes for Classification of Symbolic Data, "Prace Naukowe Uniwersytetu Łódzkiego", Folia Oeconomica (w druku).
Florek K., Łukasiewicz J., Perkal J., Steinhaus H., Zubrzycki S. (1951), Taksonomia wrocławska, "Przegląd Antropologiczny" 17, s. 193-210.
Gordon A.D. (1999), Classification, Chapman and Hall/CRC, London.
Hardy A., Lallemand P. (2004), Clustering Symbolic Objects Described by Multi-Valued and Modal Variables, [w:] D. Banks i in. (red.), Classification, Clustering and Data Mining Applications, Springer, Berlin, s. 325-332.
Hubert L.J. (1974), Approximate Evaluation Technique for the Single-Link and Complete-Link Hierarchical Clustering Procedures, "Journal of the American Statistical Association" vol. 69, nr 347, s. 698-704.
Hubert L.J., Levine J.R. (1976), Evaluating Object Set Partitions: Free Sort Analysis and Some Generalizations, "Journal of Verbal Learning and Verbal Behaviour" vol. 15, s. 549-570.
Ichino M., Yaguchi H. (1994), Generalized Minkowski Metrics for Mixed Feature-Type Data Analysis, IEEE Transactions on Systems, Man, and Cybernetics, vol. 24, nr 4, s. 698-707.
Malerba D., Espozito F., Giovalle V., Tamma V. (2001), Comparing Dissimilarity Measures for Symbolic Data Analysis, materiały konferencyjne: 'New Techniques and Technologies for Statistcs' and 'Exchange of Technology and Know-How' (ETK-NTTS'01), s. 473-481.
Milligan G.W., Cooper M.C. (1985), An Examination of Procedures for Determining the Number of Clusters in a Data Set, "Psychometrika" nr 2, s. 159-179.
Milligan G.W. (1996), Clustering Validation: Results and Implications for Applied Analyses, [w:] P. Arabie, L.J. Hubert, G. de Soete (red.), Clustering and Classification, World Scientific, Singapore, s. 341-375.
Verde R., Lechevalier Y., Chavent M. (2003), Symbolic Clustering Interpretation and Visualization, "The Electronic Journal of Symbolic Data Analysis" vol. 1, nr 1.

Typ dokumentu

Bibliografia

Identyfikatory

Identyfikator YADDA

bwmeta1.element.ekon-element-000171478721

Komentarze

Musisz być zalogowany aby pisać komentarze.

Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Taksonomia

Metoda taksonomii wrocławskiej w klasyfikacji obiektów symbolicznych

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane