PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2008 | 15 | nr 7 (1207) Klasyfikacja i analiza danych - teoria i zastosowania | 44--56
Tytuł artykułu

Procedura analizy skupień z wykorzystaniem programu komputerowego clusterSim i środowiska R

Autorzy
Warianty tytułu
Cluster Analysis Procedure with ClusterSim Computer Programme and E Environment
Języki publikacji
PL
Abstrakty
W artykule scharakteryzowane zostaną funkcje pomocnicze clusterSim oraz wybrane funkcje pakietów stats, luster ade4, służące poszczególnym etapom analizy skupień. Ponadto zaprezentowane zostaną przykładowe składnie poleceń (procedury) ułatwiające potencjalnemu użytkownikowi realizację wielu zagadnień klasyfikacyjnych niedostępnych w podstawowych pakietach statystycznych (np. SPSS, Statistica, S-Plus, SAS). (fragment tekstu)
EN
The first part of the article presents major steps in a cluster analysis procedure (see [Milligan 1996, 342-343; Walesiak 2005]). The next part presents the functions of clusterSim, stats, cluster, and ade4 packages of R environment which are applied to solving clustering problems in each stage of this procedure. Also the examples of the syntax (procedures) for solving different clustering problems are presented. These procedures help to resolve a broad range of classification problems that are not available in statistical packages (e.g. SPSS, Statistica, S-Plus, SAS). (original abstract)
Twórcy
  • Uniwersytet Ekonomiczny we Wrocławiu
Bibliografia
  • Breckenridge J.N. (2000), Validating Cluster Analysis: Consistent Replication and Symmetry, „Multivariate Behavioral Research", 35 (2), s. 261-285.
  • Caliński R.B., Harabasz J. (1974), A Dendrite Method for Cluster Analysis, „Communications in Statistics", vol. 3, s. 1-27.
  • Carmone F.J., Kara A., Maxwell S. (1999), HINoV: a New Method to Improve Market Segment Definition by Identifying Noisy Variables, „Journal of Marketing Research", November, vol. 36, s. 501-509.
  • Hartigan J. (1975), Clustering Algorithms, Wiley, New York.
  • Hubert L. (1974), Approximate Evaluation Technique for the Single-link and Complete-link Hierarchical Clustering Procedures, „Journal of the American Statistical Association", vol. 69, nr 347, s. 698-704.
  • Kaufman L., Rousseeuw P.J. (1990), Finding Groups in Data: an Introduction to Cluster Analysis, Wiley, New York.
  • Milligan G.W. (1996), Clustering Validation: Results and Implications for Applied Analyses, [w:] Clustering and Classification, red. P. Arabie, L.J. Hubert, G. de Soete, World Scientific, Singapore, s. 341-375.
  • Milligan G.W.. Cooper M.C. (1985), An Examination of Procedures of Determining the Number of Cluster in a Data Set, “Psychometrika". vol. 50, nr 2, s. 159-179.
  • K Development Core Team (2006), R: A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Vienna. URL http: R-project.org.
  • Tibshirani R., Walther G., Hastic T. (2001), Estimating the Number of Clusters in a Data Set via the Gap Statistic, „Journal of the Royal Statistical Society", ser. B, vol. 63, part 2, s. 411-423.
  • Walesiak M. (2005), Rekomendacje w zakresie strategii postępowania w procesie klasyfikacji zbioru obiektów, [w:] Przestrzenno-czasowe modelowanie i prognozowanie zjawisk gospodarczych, red. A. Zeliaś, AE, Kraków, s. 185-203.
  • Walesiak M. (2006), Uogólniona miara odległości GDM w programie komputerowym clusterSim dla środowiska R, [w:] Taksonomia 14, red. K. Jajuga, M. Walesiak, Prace Naukowe Akademii Ekonomicznej we Wrocławiu nr 1169, AE, Wrocław.
  • Walesiak M., Dudek A. (2006), Symulacyjna optymalizacja wyboru procedury klasyfikacyjnej dla danego typu danych - oprogramowanie komputerowe i wyniki badań, [w:] Taksonomia 13, red. K. Jajuga, M. Walesiak, Prace Naukowe Akademii Ekonomicznej we Wrocławiu nr 1126, AE, Wrocław, s. 120-129.
  • Walesiak M., Dudek A. (2007a), Symulacyjna optymalizacja wyboru procedury klasyfikacyjnej dla danego typu danych - charakterystyka problemu, Zeszyty Naukowe Uniwersytetu Szczecińskiego nr 450, s. 635-646.
  • Walesiak M., Dudek A. (2007b), Determination of Optimal Clustering Procedure for a Data Set, 30th Annual Conference of the Gentian Classification Society (GfKl) „Advances in Data Analysis", Berlin, March 8-10, 2006.
  • Walesiak M. (2007), Ocena stabilności wyników klasyfikacji z wykorzystaniem analizy replikacji, Prace Naukowe Akademii Ekonomicznej we Wrocławiu (w przygotowaniu).
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000168574852

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.