PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2007 | 14 | nr 1169 Klasyfikacja i analiza danych - teoria i zastosowania | 202--209
Tytuł artykułu

Porównanie metod doboru zmiennych do zagregowanych modeli dyskryminacyjnych

Warianty tytułu
The Comparison Selection Methods of Variables into Aggregated Discriminant Models
Języki publikacji
PL
Abstrakty
W artykule przedstawione zostaną wyniki symulacji porównawczej metod doboru zmiennych do modeli składowych na podstawie repozytorium danych z Uniwersytetu Kalifornijskiego w Irvine, przy czym porównanie błędów klasyfikacji zostanie przeprowadzone dla różnych miar zależności zmiennych. W badaniu wykorzystano metody: correlation-based feature selection, correlation-based feature selection based on Hellwig heuristics oraz modyfikację metody CFSH wykorzystującą do optymalizacji algorytmy genetyczne. (fragment tekstu)
EN
In discriminant analysis studies, models using single classification trees are often replaced by models aggregating partial models into one multiple model. Between selection methods of objects into aggregated models boosting, bagging, adaptive bagging, arcing, windowing are most commonly used. The most effective method of selection of variables into aggregated models is Correlation-based Feature Selection (CFS) developed by Hall. Gatnar proposed Correlation-based Feature Selection based on Hellwig Heuristic (CFSH) method and empirically showed that CFSH gives smaller classification errors that CFS. In this paper comparison between CFS, CFSH and modification of CFSH method based on optimization through genetic algorithms is presented. (original abstract)
Twórcy
  • Akademia Ekonomiczna we Wrocławiu
  • Akademia Ekonomiczna we Wrocławiu
Bibliografia
  • Breiman L. (1996), Bagging Predictors, "Machine Learning" 24, s. 123-140.
  • Breiman L. (2001), Random Forests,,Machine Learning" 45, s. 5-32.
  • Dudek A., Kurzydłowski A. (2006), Dobór zmiennych do zagregowanych modeli dyskryminacyjnych z wykorzystaniem algorytmów genetycznych, materiały z XXXII Konferencji Ekonometryków, Statystyków i Matematyków (w recenzji).
  • Gatnar E. (2001), Nieparametryczna metoda dyskryminacji i regresji. Wydawnictwo Naukowe PWN, Warszawa.
  • Gatnar E. (2003), O pewnej metodzie redukcji błędu klasyfikacji, "Prace Naukowe AE we Wrocławiu", nr 988, AE, Wrocław, s. 245-253.
  • Gatnar E. (2005), Dobór zmiennych do zagregowanych modeli dyskryminacyjnych, "Prace Naukowe AE we Wrocławiu" nr 1076, AE, Wrocław, s. 79-85.
  • Gatnar E., Walesiak M. (red.) (2004), Metody statystycznej analizy wielowymiarowej w badaniach marketingowych, AE, Wrocław.
  • Goldberg J. (2003), Algorytmy genetyczne i ich zastosowania, WNT, Warszawa.
  • Hall M. (2000), Correlation-based Feature Selection for Discrete and Numeric Machine Learning, [w:] Proceedings of the 17th International Conference on Machine Learning, Morgan Kaufmann, San Francisco.
  • Hellwig Z. (1969), O problemie optymalnego wyboru predykant, "Przegląd Statystyczny" 3-4.
  • Но Т.K. (1998), The Random Subspace Method for Constructing Decision Forests, "IEEE Transactions on Pattern Analysis and Machine Learning" 20, s. 832-844.
  • Theil H. (1972), Statistical Decomposition Analysis, North-Holland Publishing, Amsterdam.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171478735

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.