Procedura analizy skupień z wykorzystaniem programu komputerowego clusterSim i środowiska R

Walesiak, Marek

Artykuł - szczegóły

Czasopismo

Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu. Taksonomia

2008 | 15 | nr 7 (1207) Klasyfikacja i analiza danych - teoria i zastosowania | 44--56

Tytuł artykułu

Procedura analizy skupień z wykorzystaniem programu komputerowego clusterSim i środowiska R

Autorzy

Marek Walesiak

Treść / Zawartość

Pełne teksty:

http://dbc.wroc.pl/dlibra/publication/163313 [zdalny]

Warianty tytułu

Cluster Analysis Procedure with ClusterSim Computer Programme and E Environment

Języki publikacji

Abstrakty

W artykule scharakteryzowane zostaną funkcje pomocnicze clusterSim oraz wybrane funkcje pakietów stats, luster ade4, służące poszczególnym etapom analizy skupień. Ponadto zaprezentowane zostaną przykładowe składnie poleceń (procedury) ułatwiające potencjalnemu użytkownikowi realizację wielu zagadnień klasyfikacyjnych niedostępnych w podstawowych pakietach statystycznych (np. SPSS, Statistica, S-Plus, SAS). (fragment tekstu)

The first part of the article presents major steps in a cluster analysis procedure (see [Milligan 1996, 342-343; Walesiak 2005]). The next part presents the functions of clusterSim, stats, cluster, and ade4 packages of R environment which are applied to solving clustering problems in each stage of this procedure. Also the examples of the syntax (procedures) for solving different clustering problems are presented. These procedures help to resolve a broad range of classification problems that are not available in statistical packages (e.g. SPSS, Statistica, S-Plus, SAS). (original abstract)

Słowa kluczowe

Analiza skupień Programy komputerowe Funkcje Pakiet statystyczny

Cluster analysis Computer programs Functions Statistical package

Czasopismo

Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu. Taksonomia

Rocznik

2008

Tom

Numer

nr 7 (1207) Klasyfikacja i analiza danych - teoria i zastosowania

Strony

44--56

Opis fizyczny

Twórcy

autor

Marek Walesiak

Uniwersytet Ekonomiczny we Wrocławiu

Bibliografia

Breckenridge J.N. (2000), Validating Cluster Analysis: Consistent Replication and Symmetry, „Multivariate Behavioral Research", 35 (2), s. 261-285.
Caliński R.B., Harabasz J. (1974), A Dendrite Method for Cluster Analysis, „Communications in Statistics", vol. 3, s. 1-27.
Carmone F.J., Kara A., Maxwell S. (1999), HINoV: a New Method to Improve Market Segment Definition by Identifying Noisy Variables, „Journal of Marketing Research", November, vol. 36, s. 501-509.
Hartigan J. (1975), Clustering Algorithms, Wiley, New York.
Hubert L. (1974), Approximate Evaluation Technique for the Single-link and Complete-link Hierarchical Clustering Procedures, „Journal of the American Statistical Association", vol. 69, nr 347, s. 698-704.
Kaufman L., Rousseeuw P.J. (1990), Finding Groups in Data: an Introduction to Cluster Analysis, Wiley, New York.
Milligan G.W. (1996), Clustering Validation: Results and Implications for Applied Analyses, [w:] Clustering and Classification, red. P. Arabie, L.J. Hubert, G. de Soete, World Scientific, Singapore, s. 341-375.
Milligan G.W.. Cooper M.C. (1985), An Examination of Procedures of Determining the Number of Cluster in a Data Set, “Psychometrika". vol. 50, nr 2, s. 159-179.
K Development Core Team (2006), R: A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Vienna. URL http: R-project.org.
Tibshirani R., Walther G., Hastic T. (2001), Estimating the Number of Clusters in a Data Set via the Gap Statistic, „Journal of the Royal Statistical Society", ser. B, vol. 63, part 2, s. 411-423.
Walesiak M. (2005), Rekomendacje w zakresie strategii postępowania w procesie klasyfikacji zbioru obiektów, [w:] Przestrzenno-czasowe modelowanie i prognozowanie zjawisk gospodarczych, red. A. Zeliaś, AE, Kraków, s. 185-203.
Walesiak M. (2006), Uogólniona miara odległości GDM w programie komputerowym clusterSim dla środowiska R, [w:] Taksonomia 14, red. K. Jajuga, M. Walesiak, Prace Naukowe Akademii Ekonomicznej we Wrocławiu nr 1169, AE, Wrocław.
Walesiak M., Dudek A. (2006), Symulacyjna optymalizacja wyboru procedury klasyfikacyjnej dla danego typu danych - oprogramowanie komputerowe i wyniki badań, [w:] Taksonomia 13, red. K. Jajuga, M. Walesiak, Prace Naukowe Akademii Ekonomicznej we Wrocławiu nr 1126, AE, Wrocław, s. 120-129.
Walesiak M., Dudek A. (2007a), Symulacyjna optymalizacja wyboru procedury klasyfikacyjnej dla danego typu danych - charakterystyka problemu, Zeszyty Naukowe Uniwersytetu Szczecińskiego nr 450, s. 635-646.
Walesiak M., Dudek A. (2007b), Determination of Optimal Clustering Procedure for a Data Set, 30th Annual Conference of the Gentian Classification Society (GfKl) „Advances in Data Analysis", Berlin, March 8-10, 2006.
Walesiak M. (2007), Ocena stabilności wyników klasyfikacji z wykorzystaniem analizy replikacji, Prace Naukowe Akademii Ekonomicznej we Wrocławiu (w przygotowaniu).

Typ dokumentu

Bibliografia

Identyfikatory

Identyfikator YADDA

bwmeta1.element.ekon-element-000168574852

Komentarze

Musisz być zalogowany aby pisać komentarze.

Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu. Taksonomia

Procedura analizy skupień z wykorzystaniem programu komputerowego clusterSim i środowiska R

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane