Warianty tytułu
Analysis of the Effectiveness of Selected Agglomeration Methods in the Application of a Modified Stopping Rule
Języki publikacji
Abstrakty
Głównym celem opracowania była analiza efektywności wybranych metod aglomeracyjnych w zastosowaniu zmodyfikowanej reguły stop przy zrównoważonych rozkładach liczebności. W opracowaniu autor proponuje zastosowanie podejścia symulacyjnego metody Monte Carlo do testowania jednorodności zbioru danych z wykorzystaniem metody Warda.
There are approximately 30 existing rules for establishing cut-off points in agglomerations (equivalent to cutting in a dendogram) with the aim of obtaining groups. Only some of these rules try to introduce elements aimed at drawing statistical conclusions. Three such approaches are possible: the application of classical significance tests, empirical tests, and Monte Carlo tests. The possibilities of using the classical approach have not so far been exploited, for there in no way, from an analytical point of view, to derive the underlying probability distribution. In this study, the author proposes a modified simulation method for establishing cut-offpoints in the agglomeration process. One reason for the difficulties arising from a direct application of the above methods is the need to standardise data sets in each case in taxonometric research. For it turns out that the standardisation process deforms the collective structure resulting in very high "pressure" on the elements of sub-groups when multi-group structures are maintained. As a result, sequences of agglomeration intervals maintained with the use of hierarchisation methods are sequences involving very small numbers in comparison with a sequence of critical values corresponding to them and obtained when assuming the authenticity of the hypothesis regarding the homogeneity ("single-group homogeneity") of a normal, multidimensional distribution. In effect, even a leap in value which is easily observable with the naked eye in the course of an interval corresponding to the connection of two sub-groups is "intangible" via a sequence of critical values. This problem did not appear when the Ward method was used. The author seeks solutions by finding an appropriate method to rescale the sequence of "raw" empirical values. (original abstract)
Rocznik
Numer
Strony
47--57
Opis fizyczny
Twórcy
autor
Bibliografia
- Blashfield R.K. [1976], Mixture Model Tests of Cluster Analysis: Accuracy of Four Agglomerative Hierarchical Methods, "Psychological Bulletin", nr 83.
- Blashfield R.K. [1980], The Growth of Cluster Analysis: Tryon, Ward and Johnson, "Multivariate Behavioural Research", nr 15.
- Cunningham K.M., Ogilvie J.C. [1972], Evaluation of Hierarchical Grouping Techniques: A Preliminary Study, "Computer Journal", nr 15.
- Degens P.O., Federkiel H. [1978], A Monte Carlo Study on a Agglomerative Large Sample Clustering, Compstat 3, Physica Verlag, Wien.
- Denkowska S., Sokołowski A. [1997], Wykorzystanie metod symulacyjnych w aglomeracyjnych metodach hierarchicznych, XXXIII Konferencja Naukowa Ekonometryków, Statystyków i Matematyków Akademii Ekonomicznych Polski Południowej, Szklarska Poręba.
- Du Bien J.L., Werde W.D. [1979], A Mathematical Comparison of the Members of an Infinite Family of Agglomerative Clustering Algorithms, "Canadian Journal of Statistics", nr 7.
- Grabiński T., Sokołowski A. [1980], The Effectiveness of Some Signal Identyfication Procedures [w:] Signal Processing: Theories and Applications, M. Kunt, F. de Coulon (eds), North-Holland Publ., Eurasip, Amsterdam.
- Grabiński T., Sokołowski A. [1984], Z badań nad efektywnością wybranych procedur taksonomicznych, Zeszyty Naukowe AE w Krakowie, Kraków, nr 181.
- Grabiński T., Wydymus S., Zeliaś A. [1989], Metody taksonomii numerycznej w modelowaniu zjawisk społeczno-gospodarczych, pod red. A. Zeliasia, PWN, Warszawa.
- Kucharczyk J. [1982], Algorytmy analizy skupień w języku Algol 60, PWN, Warszawa.
- Kuiper F.K., Fisher L. [1975], A Monte Carlo Comparison of Six Clustering Procedures, "Biometrics", nr 31.
- Metody taksonomiczne w badaniach społeczno-ekonomicznych [1988], J. Pociecha, B. Podolec, A. Sokołowski, K. Zając, PWN, Warszawa.
- Monte Carlo Comparison of Selected Clustering Procedures [1980], C.K. Bayne, J.J. Beau- champ, C.L. Begovich, V.E. Kane, "Pattern Recognition", nr 12.
- Nowak E. [1990], Metody taksonomiczne w klasyfikacji obiektów społeczno-ekonomicznych, PWE, Warszawa.
- Smoluk A. [1976], Uwagi o dyskryminacji w zwartych przestrzeniach metrycznych, "Przegląd Statystyczny", nr 23.
- Sokołowski A., HIERA - Hierarchiczne metody taksonomiczne, maszynopis.
- Sokołowski A. [1976], Metoda porównywania wyników podziału zbioru skończonego, XII Konferencja Naukowa Ekonometryków, Statystyków i Matematyków Akademii Ekonomicznych Polski Południowej, Karpacz.
- Sokołowski A. [1992], Empiryczne testy istotności w taksonomii, AE w Krakowie, Seria specjalna: Monografie, Kraków.
- Zieliński R. [1979], Generatory liczb losowych, WNT, Warszawa 1979.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000000011645