PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2008 | Zarządzanie, finanse, ekonomia : warsztaty doktoranckie '07 | 495--504
Tytuł artykułu

Obserwacje nietypowe w analizie skupień - podejście modelowe

Autorzy
Warianty tytułu
Języki publikacji
PL
Abstrakty
Podejście modelowe w taksonomii (model-based clustering) zakłada, że obserwacje pochodzą z pewnego skończonego zbioru prostych rozkładów prawdopodobieństwa o nieznanych parametrach. W praktyce najczęściej wykorzystywany jest rozkład normalny. W modelach mieszanek każda zmienna sztuczna, której prawdopodobieństwa nie znamy, przypisana jest odpowiedniej klasie. Problem wyboru najlepszej z metod klasyfikacji i optymalnej liczby klas sprowadza się do wyboru modelu statystycznego o najlepszej jakości dopasowania. Celem artykułu jest przedstawienie podejścia modelowego w analizie skupień jako metody odpornej na obserwacje nietypowe. Dokonano modyfikacji modelu mieszanek poprzez dodanie dodatkowej, sztucznej zmiennej (klasy) modelu dla obserwacji nietypowych, przyjmujących rozkład Poissona. (fragment tekstu)
Twórcy
autor
  • Akademia Ekonomiczna im. Karola Adamieckiego w Katowicach, doktorant
Bibliografia
  • Allard D., Fraley C. (1997): Nonparametric Maximum Likelihood Estimation of Features in Spatial Point Processes Using Voronoϊ Tessellation. "Journal of American Statistician Association", No 92, pp. 1485-1493.
  • Banfield J.D., Raftery A.E. (1993): Model-Based Gaussian and Non-Gaussian Clustering. "Biometrics", No 49, pp. 803-821.
  • Bensmail H., Celeux G., Govaert G., Langrognet F. (2006): Model-Based Cluster and Disriminant Analysis with the MIXMOD Software. "Computational Statistics and Data Analysis", No 51, pp. 587-600.
  • Bensmail H., Celeux G., Raftery A.E., Robert C.P. (1997): Inference in Model-Based Cluster Analysis. "Statistics and Computing", No 7, pp. 1-10.
  • Bock H.H. (1996): Probabilistic Models in Cluster Analysis. "Computational Statistics and Data Analysis", No 23, pp. 5-28.
  • Bock H.H. (1998a): Probabilistic Approaches in Cluster Analysis. "Bulletin of the International Statistical Institute", No 57, pp. 603-606.
  • Bock H.H. (1998b): Probabilistic Aspects in Classification. In: Data Science. Classification and Related Methods. Eds: C. Hayashi, K. Yajima, H.H Bock, N. Oshumi, Y. Tanaka, Y. Baba, Springer Verlag, New York, pp. 3-21.
  • Byers S., Raftery A.E. (1996): Nearest Neighbour Clutter Removal for Esitmating Features in Spatial Point Processes. "Technical Report", 305, University of Washington.
  • Cheeseman P., Stuzt J. (1995): Bayessian Classification (AutoClass): Theory and Results. In: Advances in Knowledge Discovery and Data Mining. Eds: U. Fayyad, G. Piatesky-Shapiro, P. Smyth, R. Urthurusamy, AAAI Press, pp. 153-180.
  • Dasgupta A., Raftery A.E. (1998): Detecting Features in Spatial Point Processes with Clutter via~ Model-Based Clustering. "Journal of American Statistician Association", No 93, pp. 294-302.
  • Dempster A.R, Laird N.M., Rubin D.B. (1977): Maxiumum Likelihood for Incomplete Data via the EM Algorithm (with Discussion). "Journal of the Royal Statistical Society", Seria B, No 39, pp. 1-38.
  • Fraley C., Raftery A.E. (1998): How Many Clusters? Which Clustering Method? Answers via Model-Based Cluster Analysis. "The Computer Journal", No 41, pp. 577-588.
  • Fraley C., Raftery A.E. (2002): Model-Based Clustering, Discriminant Analysis, and Density Estimation. "Journal of the American Statistical Association", No 97, pp. 611-631.
  • Fraley C., Raftery A.E. (2006): MCLUST Version 3.- An R Package for Normal Mixture Modelling and Model-Based Clustering. "Technical Report 504", University of Washington, pp. 1-50.
  • Gatnar E., Walesiak M. (2004): Metody statystycznej analizy wielowymiarowej w badaniach marketingowych. AE, Wrocław, s. 316-350.
  • Kass R.E., Raftery A.E. (1995): Bayes Factors. "Journal of the American Statistical Association", No 90, pp. 928-934.
  • McLachlan G.J., Krishnan T. (1988): Mixture Models: Inference and Applications to Clustering. G. J. Marcel Dekker, New York.
  • Schwarz G. (1978): Estimating the Dimension of a Model. "The Annals of Statistics", No 6, pp. 461-464.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171295289

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.