Czasopismo
Tytuł artykułu
Autorzy
Warianty tytułu
Języki publikacji
Abstrakty
Podejście modelowe w taksonomii (model-based clustering) zakłada, że obserwacje pochodzą z pewnego skończonego zbioru prostych rozkładów prawdopodobieństwa o nieznanych parametrach. W praktyce najczęściej wykorzystywany jest rozkład normalny. W modelach mieszanek każda zmienna sztuczna, której prawdopodobieństwa nie znamy, przypisana jest odpowiedniej klasie. Problem wyboru najlepszej z metod klasyfikacji i optymalnej liczby klas sprowadza się do wyboru modelu statystycznego o najlepszej jakości dopasowania. Celem artykułu jest przedstawienie podejścia modelowego w analizie skupień jako metody odpornej na obserwacje nietypowe. Dokonano modyfikacji modelu mieszanek poprzez dodanie dodatkowej, sztucznej zmiennej (klasy) modelu dla obserwacji nietypowych, przyjmujących rozkład Poissona. (fragment tekstu)
Słowa kluczowe
Rocznik
Strony
495--504
Opis fizyczny
Twórcy
autor
- Akademia Ekonomiczna im. Karola Adamieckiego w Katowicach, doktorant
Bibliografia
- Allard D., Fraley C. (1997): Nonparametric Maximum Likelihood Estimation of Features in Spatial Point Processes Using Voronoϊ Tessellation. "Journal of American Statistician Association", No 92, pp. 1485-1493.
- Banfield J.D., Raftery A.E. (1993): Model-Based Gaussian and Non-Gaussian Clustering. "Biometrics", No 49, pp. 803-821.
- Bensmail H., Celeux G., Govaert G., Langrognet F. (2006): Model-Based Cluster and Disriminant Analysis with the MIXMOD Software. "Computational Statistics and Data Analysis", No 51, pp. 587-600.
- Bensmail H., Celeux G., Raftery A.E., Robert C.P. (1997): Inference in Model-Based Cluster Analysis. "Statistics and Computing", No 7, pp. 1-10.
- Bock H.H. (1996): Probabilistic Models in Cluster Analysis. "Computational Statistics and Data Analysis", No 23, pp. 5-28.
- Bock H.H. (1998a): Probabilistic Approaches in Cluster Analysis. "Bulletin of the International Statistical Institute", No 57, pp. 603-606.
- Bock H.H. (1998b): Probabilistic Aspects in Classification. In: Data Science. Classification and Related Methods. Eds: C. Hayashi, K. Yajima, H.H Bock, N. Oshumi, Y. Tanaka, Y. Baba, Springer Verlag, New York, pp. 3-21.
- Byers S., Raftery A.E. (1996): Nearest Neighbour Clutter Removal for Esitmating Features in Spatial Point Processes. "Technical Report", 305, University of Washington.
- Cheeseman P., Stuzt J. (1995): Bayessian Classification (AutoClass): Theory and Results. In: Advances in Knowledge Discovery and Data Mining. Eds: U. Fayyad, G. Piatesky-Shapiro, P. Smyth, R. Urthurusamy, AAAI Press, pp. 153-180.
- Dasgupta A., Raftery A.E. (1998): Detecting Features in Spatial Point Processes with Clutter via~ Model-Based Clustering. "Journal of American Statistician Association", No 93, pp. 294-302.
- Dempster A.R, Laird N.M., Rubin D.B. (1977): Maxiumum Likelihood for Incomplete Data via the EM Algorithm (with Discussion). "Journal of the Royal Statistical Society", Seria B, No 39, pp. 1-38.
- Fraley C., Raftery A.E. (1998): How Many Clusters? Which Clustering Method? Answers via Model-Based Cluster Analysis. "The Computer Journal", No 41, pp. 577-588.
- Fraley C., Raftery A.E. (2002): Model-Based Clustering, Discriminant Analysis, and Density Estimation. "Journal of the American Statistical Association", No 97, pp. 611-631.
- Fraley C., Raftery A.E. (2006): MCLUST Version 3.- An R Package for Normal Mixture Modelling and Model-Based Clustering. "Technical Report 504", University of Washington, pp. 1-50.
- Gatnar E., Walesiak M. (2004): Metody statystycznej analizy wielowymiarowej w badaniach marketingowych. AE, Wrocław, s. 316-350.
- Kass R.E., Raftery A.E. (1995): Bayes Factors. "Journal of the American Statistical Association", No 90, pp. 928-934.
- McLachlan G.J., Krishnan T. (1988): Mixture Models: Inference and Applications to Clustering. G. J. Marcel Dekker, New York.
- Schwarz G. (1978): Estimating the Dimension of a Model. "The Annals of Statistics", No 6, pp. 461-464.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171295289