Czasopismo
Tytuł artykułu
Autorzy
Warianty tytułu
Aggregation of Discriminant Models
Języki publikacji
Abstrakty
Szczególnie ważną cechą modeli dyskryminacyjnych jest ich jak największa trafność prognostyczna, tj. dokładność przewidywania wartości zmiennej y dla obiektów ze zbioru rozpoznanego. Wpływ na to ma wiele czynników, z których najważniejszym jest struktura zbioru uczącego. Okazuje się, że dużo dokładniejsze wyniki predykacji, daje złożony model dyskryminacyjny, będący wynikiem agregacji (połączenia) kilku indywidualnych modeli, powstałych w oparciu o różne zbiory uczące. Autor omówił zagadnienie sposobu oceny wielkości błędu klasyfikacji e(D) dla pewnego modelu dyskryminacyjnego D, zwłaszcza w przypadku, gdy nie jest dostępny zbiór testowy. Dalej autor przedstawił szczegółowo dwie metody agregacji pojedynczych modeli dyskryminacyjnych (agregacja bootstrapowa i losowanie adaptacyjne oraz łączenie), dzięki którym ten błąd można zredukować. Przedstawiony przykład obliczeniowy pokazał, że najmniejszy błąd klasyfikacji można uzyskać stosując metodę losowania adaptacyjnego (boosting).
A discriminant model is built on the base of a learning sample, but will be applied to the set of objects to be classified. Therefore, evaluation of its predictive accuracy must be based on an independent set (test sample) or a part of the learning sample will be used as the test set. But much more accurate model could be created as a result of combining several simple discriminant models. In this paper several different methods of estimation of the classification error are discussed, e.g. cross-validation, bootstrap etc. and two aggregation methods are presented: bootstrap aggregation, or bagging in short, adaptive resampling and combining, also known as ARCing, or boosting. (original abstract)
Rocznik
Tom
Strony
217--226
Opis fizyczny
Twórcy
autor
Bibliografia
- Blake C., Keogh E., Merz C.J. (1998): UCI Repository of Machine Learning Databases, Department of Information and Computer Science, University of California, Irvine, CA.
- Breiman L. (1998): Arcing Classifiers, "Annals of Statistics" 26, s. 801-849.
- Breiman L. (1996): Bagging Predictors, "Machine Learning" 24, s. 123-140.
- Breiman L., Friedman J., Olshen R., Stone C. (1984): Classification and Regression Trees, Chapman & Hall/CRC Press, London.
- Freund Y., Schapire R.E. (1997): A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting "Journal of Computer and System Sciences" 55, s. 119-139.
- Gatnar E. (2001): Nieparametryczna metoda dyskryminacji i regresji, PWN, Warszawa.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000000012168