PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2009 | 16 | nr 47 Klasyfikacja i analiza danych - teoria i zastosowania | 189--195
Tytuł artykułu

Zastosowanie macierzy współwystąpień w metodzie bagging w taksonomii

Autorzy
Warianty tytułu
Applying of Co-occurrence Matrix in Bagging in Taxonomy
Języki publikacji
PL
Abstrakty
Badanie niniejsze wypływa z trzech źródeł. Pierwszym jest zaproponowane przez Pekalską i Duin [2000] w dyskryminacji podejście oparte na opisie zbioru obiektów przez podobieństwo (bądź niepodobieństwo). W tradycyjnym zagadnieniu modele klasyfikacyjne budowane są na podstawie zbioru zawierającego zmienne charakteryzujące poszczególne obserwacje. Alternatywą dla tego klasycznego opisu obiektów może być zaproponowane przez wspomnianych autorów podejście oparte na macierzy podobieństwa (odległości) między obiektami. W ujęciu tym obiekty opisywane są przez pewną miarę obrazującą stopień podobieństwa między obserwacjami ze zbioru danych. Model zatem jest budowany na podstawie tej macierzy, która traktowana jest jako zbiór opisujący obserwacje. Drugim źródłem jest zaproponowana przez Fred i Jain [2002] idea łączenia wyników wielokrotnie dokonanej klasyfikacji w celu konstrukcji macierzy współwystąpień. Biorąc jednoczesne wystąpienie pary obiektów w tej samej klasie za wskazówkę istnienia związku między nimi, pierwotny zbiór obserwacji przekształcany jest w n × n-wymiarową macierz, która opisuje podobieństwo między obiektami. Ostateczne grupowanie dokonywane jest na podstawie uzyskanej macierzy współwystąpień, która traktowana jest jak zbiór danych. Trzecim źródłem jest zaproponowane przez Dudoit i Fridlyand [2003] podejście wielomodelowe w taksonomii wykorzystujące ideę metody bagging. Zasadniczym celem badań jest porównanie zdolności do odkrywania poprawnej struktury klas dla metody bagging w taksonomii zastosowanej dla pierwotnego zbioru danych oraz skonstruowanej macierzy współwystąpień. (fragment tekstu)
EN
Ensemble approach has been successfully applied in the context of supervised learning to increase the accuracy and stability of classification. Recently, analogous techniques for cluster analysis have been suggested. The main aim of this article is to introduce one of the ensemble techniques in taxonomy [Dudoit, Fridlyand 2003] and to compare the accuracy of classification with traditional algorithms. The novelty of this article flows from the fact of joining proposed by Dudoid and Fridlyand [2003] bagging technique in taxonomy with the concept of describing the objects by co-occurrence (co-association) matrix [Fred, Jain 2002]. In this matrix objects are described by some distance measure showing the similarity between objects. (original abstract)
Słowa kluczowe
Twórcy
  • Uniwersytet Ekonomiczny w Katowicach
Bibliografia
  • Blake C., Keogh E., Merz C.J. (1988), UCI repository of machine learning databases, Department of Information and Computer Science, University of California, Irvine.
  • Breiman L. (1996), Bagging predictors, "Machine Learning" no 26(2), s. 123-140.
  • Dudoit S., Fridlyand J. (2003), Bagging to improve the accuracy of a clustering procedure, "Bioinformatics" vol. 19 no 9, s. 1090-1099.
  • Fred N.L., Jain A.K. (2002), Combining multiple clusterings using evidence accumulation, "IEEE Transactions on PAMI" no 27(6), s. 835-850.
  • Freund Y. (1990), Boosting a weak learning algorithm by majority, "Proceedings of the Third Annual Workshop on Computational Learning Theory", s. 202-216.
  • Freund Y. (1999), An adaptive version of the boost by majority algorithm, "Proceedings of the Twelfth Annual Conference on Computational Learning Theory", s. 293-318.
  • Pekalska E., Duin R.P.W. (2000), Classifiers for dissimilarity-based pattern recognition, [w:] A. Sanfeliu, J.J. Villanueva, M. Vanrell, R. Alquezar, A.K. Jain, J. Kittler (red.), "Proceedings Fifteenth International Conference on Pattern Recognition", IEEE Computer Society, Press, Los Alamitos, s. 12-16.
  • Rand W.M. (1971), Objective criteria for the evaluation of clustering methods, "Journal of the American Statistical Association" no 336, s. 846-850.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171368801

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.