PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2011 | 255 Methodological Aspects of Multivariate Statistical Analysis : Statistical Models and Applications | 175--182
Tytuł artykułu

Comparison of Stability of Algorithms in Classical and Ensemble Approach in Taxonomy

Autorzy
Treść / Zawartość
Warianty tytułu
Porównanie stabilności algorytmów w podejściu klasycznym i zagregowanym w taksonomii
Języki publikacji
EN
Abstrakty
Podejście wielomodelowe dotychczas z dużym powodzeniem stosowane było w dyskryminacji w celu podniesienia dokładności klasyfikacji. W ostatnich latach analogiczne propozycje pojawiły się w taksonomii, aby zapewnić większą poprawność i stabilność wyników grupowania. Liczne badania wykazały, że agregacja różniących się między sobą wyników wielokrotnego grupowania, pozwala na poprawę dokładności klasyfikacji. Stabilność algorytmu taksonomicznego w odniesieniu do niewielkich zmian w zbiorze danych, czy też parametrów algorytmu jest pożądaną cechą algorytmu. Z drugiej jednak strony, podejście wielomodelowe czerpie korzyści ze zróżnicowanych klasyfikacji składowych, których połączenie przynosi bardziej dokładne i stabilne rozwiązanie niż pojedynczy algorytm. Głównym punktem zainteresowania tego badania była stabilność w podejściu zagregowanym w taksonomii. Przeprowadzone badania empiryczne pokazały, że podejście zagregowane daje bardziej stabilne rezultaty niż pojedyncze algorytmy taksonomiczne oraz, że często wyższa stabilność idzie w parze z wyższą dokładnością klasyfikacji w podejściu zagregowanym. (abstrakt oryginalny)
EN
Ensemble approach has been successfully applied in the context of supervised learning to increase the accuracy and stability of classification. Recently, analogous techniques for cluster analysis have been suggested in order to increase classification accuracy, robustness and stability of the clustering solutions. Research has proved that, by combining a collection of different clusterings, an improved solution can be obtained. The stability of a clustering algorithm with respect to small perturbations of data (e.g., data subsampling or resampling, small variations in the feature values) or the parameters of the algorithm (e.g., random initialization) is a desirable quality of the algorithm. On the other hand, ensembles benefit from diverse clusterers (Fern. Brodley 2003, Green et al. 2004). Although built upon unstable components, the ensemble is expected to be more accurate and robust than the individual clustering method. Here, the stability of the ensemble is looked at. This paper carries out an experimental study to examine whether cluster ensembles give more stable results than single clustering methods. (original abstract)
Słowa kluczowe
Twórcy
  • The Karol Adamiecki University of Economics in Katowice, Poland
Bibliografia
  • Fern X. Z., Brodley C. E. (2003). Random Projection for High Dimensional Data Clustering: A Cluster Ensemble Approach. Proceedings of the 20th International Conference of Machine Learning, pages: 186-193.
  • Fred A. (2002). Finding Consistent Clusters in Data Partitions, in Roli F., Kittler J., editors. Proceedings of the International Workshop on Multiple Classifier Systems, pages: 309-318.
  • Fred A., Jain A. K. (2002). Data Clustering Using Evidence Accumulation. Proceedings of the 16th International Conference on Pattern Recognition, pages: 276-280.1CPR. Canada.
  • Greene D., Tsymbal A., Bolshakova N. and Cunningham P. (2004). Ensemble Clustering in Medical Diagnostics. Technical Report TCD-C.S-2004-12. Trinity College, Dublin, Ireland.
  • Hornik K. (2005), A CLUE for CLUster Ensembles, Journal of Statistical Software. 14:65-72
  • Jain A., Murty M. N and Flynn P. (1999), Data Clustering: A Review. ACM Computing Surveys, 31 (3): 264-323.
  • Kuncheva L., Vetrov D. (2006). Evaluation of Stability of k-Means Cluster Ensembles with
  • Respect to Random Initialization. IEEE Transactions On Pattern Analysis And Machine Intelligence. Vol. 28. No. 11, pages: 1798-1808.
  • Strehl A., Ghosh J. (2002). Cluster Ensembles - A Knowledge Reuse Framework for Combining Multiple Partitions. Journal of Machine Learning Research. 3: 583-618.
Typ dokumentu
Bibliografia
Identyfikatory
DOI
Identyfikator YADDA
bwmeta1.element.ekon-element-000171193923

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.