PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2009 | 228 Multivariate Statistical Analysis : Statistical Inference, Statistical Models and Applications | 229--235
Tytuł artykułu

On an Improvement of the Model-Based Clustering Method

Autorzy
Warianty tytułu
Języki publikacji
EN
Abstrakty
EN
An improvement of the model-based clustering (MBC) method in the ax when EM algorithm fails as a result of singularities is the basic aim of this paper. Replacement of the maximum likelihood (MLE) estimator by a maximum a posteriori MАР) estimator, also found by the EM algorithm is proposed. Models with different umber of components are compared using a modified version of BIC, where the likelihood is evaluated at the MAP instead of MLE. A highly dispersed proper conjugate prior is shown to avoid singularities, but when these are not present it gives similar results to the standard method of MBC. (original abstract)
W artykule przedstawiona została modyfikacja metody taksonomii opartej na modelach mieszanych, w przypadku gdy niemożliwym staje się oszacowanie parametrów modelu za pomocą algorytmu EM. Gdy liczba obiektów przypisanych do klasy jest mniejsza niż liczba zmiennych opisujących te obiekty, niemożliwym staje się oszacowanie parametrów modelu. By uniknąć tej sytuacji estymatory największej wiarygodności zastępowane są estymatorami o największym prawdopodobieństwie a posteriori. Wybór modelu o najlepszej parametryzacji i stosownej liczbie klas dokonywany jest wówczas za pomocą zmodyfikowanej statystyki BIC. (abstrakt oryginalny)
Twórcy
autor
  • The Karol Adamiecki University of Economics in Katowice, Poland, doktorant
Bibliografia
  • Banfield J.D., Raftery A.E. (1993), Model-based Gaussian and non-Gaussian clustering, "Biometrics", 49, 803-821.
  • Biemacki C, Celeux G., Govaert G., Langrognet F. (2006), Model-based cluster and disriminant analysis with the MIXMOD software, "Computational Statistics and Data Analysis", 51, 587-600.
  • Dasgupta A., Raftery A.E. (1998), Detecting features in spatial point processes with clutter via model-based clustering, "Journal of the American Statistical Association", 93,294-302.
  • Dempster A.P., Laird N.M., Rubin D.B. (1977), Maximum likelihood for incomplete data via the EM algorithm (with discussion), "Journal of the Royal Statistical Society", ser. B, 39, 1-38.
  • Fraley С., Raftery A.E. (1998), How many clusters? Which clustering method? Answers via model-based cluster analysis, "The Computer Journal", 41, 577-588.
  • Fraley C., Raftery A.E. (2002), Model-based clustering, discriminant analysis, and density estimation, "Journal of the American Statistical Association", 97, 611-631.
  • Fraley C., Raftery A.E. (2005), Bayesian regularisation for normal mixture estimation and model-based clustering, Technical Report 486, Department of Statistics, University of Washington
  • Fraley C., Raftery A.E. (2006), MCLUST Version 3: An R package for normal mixture modeling and model- based clustering, 1-50.
  • Gelman A., Carlin J.B., Stern H.S, Rubin D.B. (1995), Bayesian data analysis, Chapman and Hall, London.
  • McLachlan G.J., Peel D. (2000), Finite mixture models, Wiley, New York.
  • Schafer J.L. (1997), Analysis of incomplete multivariate data by simulation, Chapman and Hall, London.
  • Schwarz G. (1978), Estimating the dimension of a model, "The Annals of Statistics", 6, 461-464.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000168577526

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.