PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2007 | 14 | nr 1169 Klasyfikacja i analiza danych - teoria i zastosowania | 169--177
Tytuł artykułu

Metoda taksonomii wrocławskiej w klasyfikacji obiektów symbolicznych

Autorzy
Warianty tytułu
Dendrite Clustering in Classification of Symbolic Objects
Języki publikacji
PL
Abstrakty
Metoda taksonomii wrocławskiej, dobrze znana w wielowymiarowej analizie statystycznej, jest obecnie trochę zapomniana, ponieważ jest podobna do metody najbliższego sąsiada klasyfikacji hierarchicznej. Okazuje się jednak, iż metoda ta może zostać z powodzeniem zastosowana w odniesieniu do danych symbolicznych (dla tych danych ze względu na specyfikę miar odległości nie pojawia się problem tożsamości algorytmu z metodą najbliższego sąsiada). Artykuł przedstawia zastosowanie metody taksonomii wrocławskiej do klasyfikacji obiektów symbolicznych. W kolejnych częściach artykułu opisane są: pojęcie obiektu i zmiennej symbolicznej, miary podobieństwa obiektów symbolicznych, kroki metody taksonomii wrocławskiej, algorytmu klasyfikacji i mierniki jakości klasyfikacji dla danych symbolicznych, a także dwa eksperymenty pozwalające na ocenienie przydatności metody taksonomii wrocławskiej w klasyfikacji obiektów symbolicznych. (fragment tekstu)
EN
Dendrite clustering is used in multivariate statistical analysis for over fifty year. Despite it has been designed for "traditional" data, after minor modifications it can be adapted to symbolic data e.g. data representing: single quantitative values, categorical values, intervals, multi-valued variables, multi-valued variables with weights. In this paper usage of dendrite method for symbolic data is described, Nine clustering algorithms: Ward, single link, complete link, average link, Mcquitty, median and centroid hierarchical clustering methods, partitioning around medoids, dynamic clustering for symbolic objects are compared with dendrite method and situations where this method gives better results are pointed. (original abstract)
Twórcy
  • Akademia Ekonomiczna we Wrocławiu
Bibliografia
  • Baker F.B., Hubert L.J. (1975), Measuring the Power of Hierarchical Cluster Analysis, ,Journal of the American Statistical Association" vol. 70, nr 349, s. 31-38.
  • Bock H.H., Diday E. (red.) (2000), Analysis of Symbolic Data. Explanatory Methods for Extracting Statistical Information from Complex Data, Heidelberg-Springer-Verlag.
  • Chavent M., De Carvalho F.A.T, Verde R., Lechevallier Y. (2003), Trois nouvelle methodes de classification automatique de donnees symboliques de type intervals, "Revue de Statistique Appliquee" LI 4, s. 5-29.
  • de Carvalho F.A.T., Souza R. (1998), Statistical Proximity Functions of Boolean Symbolic Objects Based on Histograms, Advances in Data Science and Classification, Heidelberg-Springer-Verlag, 391-396.
  • Diday E. (2002), An Introduction to Symbolic Data Analysis and the SODAS Software, J.S.D.A., International E-Journal.
  • Dudek A. (2005), Internal Cluster Quality Indexes for Classification of Symbolic Data, "Prace Naukowe Uniwersytetu Łódzkiego", Folia Oeconomica (w druku).
  • Florek K., Łukasiewicz J., Perkal J., Steinhaus H., Zubrzycki S. (1951), Taksonomia wrocławska, "Przegląd Antropologiczny" 17, s. 193-210.
  • Gordon A.D. (1999), Classification, Chapman and Hall/CRC, London.
  • Hardy A., Lallemand P. (2004), Clustering Symbolic Objects Described by Multi-Valued and Modal Variables, [w:] D. Banks i in. (red.), Classification, Clustering and Data Mining Applications, Springer, Berlin, s. 325-332.
  • Hubert L.J. (1974), Approximate Evaluation Technique for the Single-Link and Complete-Link Hierarchical Clustering Procedures, "Journal of the American Statistical Association" vol. 69, nr 347, s. 698-704.
  • Hubert L.J., Levine J.R. (1976), Evaluating Object Set Partitions: Free Sort Analysis and Some Generalizations, "Journal of Verbal Learning and Verbal Behaviour" vol. 15, s. 549-570.
  • Ichino M., Yaguchi H. (1994), Generalized Minkowski Metrics for Mixed Feature-Type Data Analysis, IEEE Transactions on Systems, Man, and Cybernetics, vol. 24, nr 4, s. 698-707.
  • Malerba D., Espozito F., Giovalle V., Tamma V. (2001), Comparing Dissimilarity Measures for Symbolic Data Analysis, materiały konferencyjne: 'New Techniques and Technologies for Statistcs' and 'Exchange of Technology and Know-How' (ETK-NTTS'01), s. 473-481.
  • Milligan G.W., Cooper M.C. (1985), An Examination of Procedures for Determining the Number of Clusters in a Data Set, "Psychometrika" nr 2, s. 159-179.
  • Milligan G.W. (1996), Clustering Validation: Results and Implications for Applied Analyses, [w:] P. Arabie, L.J. Hubert, G. de Soete (red.), Clustering and Classification, World Scientific, Singapore, s. 341-375.
  • Verde R., Lechevalier Y., Chavent M. (2003), Symbolic Clustering Interpretation and Visualization, "The Electronic Journal of Symbolic Data Analysis" vol. 1, nr 1.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171478721

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.