PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2008 | 15 | nr 7 (1207) Klasyfikacja i analiza danych - teoria i zastosowania | 199--206
Tytuł artykułu

Metoda taksonomii oparta na modelach mieszanych

Autorzy
Warianty tytułu
Model-Based Clustering
Języki publikacji
PL
Abstrakty
W artykule przedstawiona zostanie metoda taksonomii oparta na modelach (MBC – model-based clustering), wykorzystująca połączenie hierarchicznej metody aglomeracyjnej opartej na modelach (model-based heirarchical clustering), algorytmu EM oraz statystyki BIC. Hierarchiczne metody aglomeracyjne oparte na modelach dokonują podziału zbioru obiektów na klasy. Podział ten ma na celu zainicjowanie algorytmu EM, który daje lepsze wyniki wtedy, gdy znamy wartości startowe, kryterium informacyjne BIC zaś pozwala na wybór modelu o największej jakości dopasowania. (fragment tekstu)
EN
In model-based clustering approach, the data are viewed as coming from a mixture of probability distributions, each representing a different cluster. Models with varying geometric properties are obtained through Gaussian components with different parameterizations and cross-cluster constraints. Partitions are determined by the EM algorithm for maximum likelihood, with initial values from agglomerative hierarchical clustering. Models are compared on the basis of Bayesian Information Criterion (BIC). The problems of determining the number of clusters and the clustering method are at the same time solved by choosing the best model. (original abstract)
Twórcy
autor
  • Akademia Ekonomiczna im. Karola Adamieckiego w Katowicach
Bibliografia
  • Banfield J.D., Raftery A.E. (1993), Model-based Gaussian and Non-gaussian Clustering, „Biometrics", 49,'s. 803-821.
  • Dasgupta A., Raftery A.E. (1998), Detecting Features in Spatial Point Processes with Clatter via Model-based Clustering, „Journal of the American Statistical Association", 93, s. 294-302.
  • Dempster A.P., Laird N.M., Rubin D.B. (1977), Maximum Likelihood for Incomplete Data via the EM Algorithm (with Discussion), „Journal of the Royal Statistical Society", Ser. B, 39, s. 1-38.
  • Fraley C., Raftery A.E. (1998), How Many Clusters? Which Clustering Method? Answers via Model-based Cluster Analysis, „The Computer Journal", 41, s. 577-588.
  • Fraley C., Raftery A.E. (2002), Model-based Clustering, Discriminant Analysis, and Density Estimation, „Journal of the American Statistical Association", 97, s. 611-631.
  • Fraley C., Raftery A.E. (2006), MCLUST Version 3: An R Package for Normal Mixture Modeling and Model-based Clustering, s. 1-50.
  • Hubert L.J., Arabie P. (1985), Comparing Partitions, „Journal of Classification", 1, s. 193-218.
  • McLachlan G.J., Basford K.E. (1988), Mixture Models: Inference and Applications to Clustering, G.J. Marcel Dekker, New York.
  • McLachlan G.J., Krishnan, T. (1997), The EM Algorithm and Extensions, Wiley, New York.
  • Reaven G.M., Miller R.G. (1979), An Attempt to Define the Nature of Chemical Diabetes Using Multidimensional Analysis, „Diabetologica", 16, s. 17-27.
  • Schwarz G. (1978), Estimating the Dimension of a Model, „The Annals of Statistics", 6, s. 461-464.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000168579594

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.