Obserwacje nietypowe w analizie skupień - podejście modelowe

Witek, Ewa

Artykuł - szczegóły

Czasopismo

Prace Naukowe / Akademia Ekonomiczna w Katowicach

2008 | Zarządzanie, finanse, ekonomia : warsztaty doktoranckie '07 | 495--504

Tytuł artykułu

Obserwacje nietypowe w analizie skupień - podejście modelowe

Autorzy

Ewa Witek

Warianty tytułu

Języki publikacji

Abstrakty

Podejście modelowe w taksonomii (model-based clustering) zakłada, że obserwacje pochodzą z pewnego skończonego zbioru prostych rozkładów prawdopodobieństwa o nieznanych parametrach. W praktyce najczęściej wykorzystywany jest rozkład normalny. W modelach mieszanek każda zmienna sztuczna, której prawdopodobieństwa nie znamy, przypisana jest odpowiedniej klasie. Problem wyboru najlepszej z metod klasyfikacji i optymalnej liczby klas sprowadza się do wyboru modelu statystycznego o najlepszej jakości dopasowania. Celem artykułu jest przedstawienie podejścia modelowego w analizie skupień jako metody odpornej na obserwacje nietypowe. Dokonano modyfikacji modelu mieszanek poprzez dodanie dodatkowej, sztucznej zmiennej (klasy) modelu dla obserwacji nietypowych, przyjmujących rozkład Poissona. (fragment tekstu)

Słowa kluczowe

Taksonomia Analiza skupień Obserwacje nietypowe

Taxonomy Cluster analysis Outliers

Czasopismo

Prace Naukowe / Akademia Ekonomiczna w Katowicach

Rocznik

2008

Tom

Zarządzanie, finanse, ekonomia : warsztaty doktoranckie '07

Strony

495--504

Opis fizyczny

Twórcy

autor

Ewa Witek

Akademia Ekonomiczna im. Karola Adamieckiego w Katowicach, doktorant

Bibliografia

Allard D., Fraley C. (1997): Nonparametric Maximum Likelihood Estimation of Features in Spatial Point Processes Using Voronoϊ Tessellation. "Journal of American Statistician Association", No 92, pp. 1485-1493.
Banfield J.D., Raftery A.E. (1993): Model-Based Gaussian and Non-Gaussian Clustering. "Biometrics", No 49, pp. 803-821.
Bensmail H., Celeux G., Govaert G., Langrognet F. (2006): Model-Based Cluster and Disriminant Analysis with the MIXMOD Software. "Computational Statistics and Data Analysis", No 51, pp. 587-600.
Bensmail H., Celeux G., Raftery A.E., Robert C.P. (1997): Inference in Model-Based Cluster Analysis. "Statistics and Computing", No 7, pp. 1-10.
Bock H.H. (1996): Probabilistic Models in Cluster Analysis. "Computational Statistics and Data Analysis", No 23, pp. 5-28.
Bock H.H. (1998a): Probabilistic Approaches in Cluster Analysis. "Bulletin of the International Statistical Institute", No 57, pp. 603-606.
Bock H.H. (1998b): Probabilistic Aspects in Classification. In: Data Science. Classification and Related Methods. Eds: C. Hayashi, K. Yajima, H.H Bock, N. Oshumi, Y. Tanaka, Y. Baba, Springer Verlag, New York, pp. 3-21.
Byers S., Raftery A.E. (1996): Nearest Neighbour Clutter Removal for Esitmating Features in Spatial Point Processes. "Technical Report", 305, University of Washington.
Cheeseman P., Stuzt J. (1995): Bayessian Classification (AutoClass): Theory and Results. In: Advances in Knowledge Discovery and Data Mining. Eds: U. Fayyad, G. Piatesky-Shapiro, P. Smyth, R. Urthurusamy, AAAI Press, pp. 153-180.
Dasgupta A., Raftery A.E. (1998): Detecting Features in Spatial Point Processes with Clutter via~ Model-Based Clustering. "Journal of American Statistician Association", No 93, pp. 294-302.
Dempster A.R, Laird N.M., Rubin D.B. (1977): Maxiumum Likelihood for Incomplete Data via the EM Algorithm (with Discussion). "Journal of the Royal Statistical Society", Seria B, No 39, pp. 1-38.
Fraley C., Raftery A.E. (1998): How Many Clusters? Which Clustering Method? Answers via Model-Based Cluster Analysis. "The Computer Journal", No 41, pp. 577-588.
Fraley C., Raftery A.E. (2002): Model-Based Clustering, Discriminant Analysis, and Density Estimation. "Journal of the American Statistical Association", No 97, pp. 611-631.
Fraley C., Raftery A.E. (2006): MCLUST Version 3.- An R Package for Normal Mixture Modelling and Model-Based Clustering. "Technical Report 504", University of Washington, pp. 1-50.
Gatnar E., Walesiak M. (2004): Metody statystycznej analizy wielowymiarowej w badaniach marketingowych. AE, Wrocław, s. 316-350.
Kass R.E., Raftery A.E. (1995): Bayes Factors. "Journal of the American Statistical Association", No 90, pp. 928-934.
McLachlan G.J., Krishnan T. (1988): Mixture Models: Inference and Applications to Clustering. G. J. Marcel Dekker, New York.
Schwarz G. (1978): Estimating the Dimension of a Model. "The Annals of Statistics", No 6, pp. 461-464.

Typ dokumentu

Bibliografia

Identyfikatory

Identyfikator YADDA

bwmeta1.element.ekon-element-000171295289

Komentarze

Musisz być zalogowany aby pisać komentarze.

Prace Naukowe / Akademia Ekonomiczna w Katowicach

Obserwacje nietypowe w analizie skupień - podejście modelowe

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane