Porównanie metod doboru zmiennych do zagregowanych modeli dyskryminacyjnych

Dudek, Andrzej; Kurzydłowski, Adam

Artykuł - szczegóły

Czasopismo

Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Taksonomia

2007 | 14 | nr 1169 Klasyfikacja i analiza danych - teoria i zastosowania | 202--209

Tytuł artykułu

Porównanie metod doboru zmiennych do zagregowanych modeli dyskryminacyjnych

Autorzy

Andrzej Dudek , Adam Kurzydłowski

Warianty tytułu

The Comparison Selection Methods of Variables into Aggregated Discriminant Models

Języki publikacji

Abstrakty

W artykule przedstawione zostaną wyniki symulacji porównawczej metod doboru zmiennych do modeli składowych na podstawie repozytorium danych z Uniwersytetu Kalifornijskiego w Irvine, przy czym porównanie błędów klasyfikacji zostanie przeprowadzone dla różnych miar zależności zmiennych. W badaniu wykorzystano metody: correlation-based feature selection, correlation-based feature selection based on Hellwig heuristics oraz modyfikację metody CFSH wykorzystującą do optymalizacji algorytmy genetyczne. (fragment tekstu)

In discriminant analysis studies, models using single classification trees are often replaced by models aggregating partial models into one multiple model. Between selection methods of objects into aggregated models boosting, bagging, adaptive bagging, arcing, windowing are most commonly used. The most effective method of selection of variables into aggregated models is Correlation-based Feature Selection (CFS) developed by Hall. Gatnar proposed Correlation-based Feature Selection based on Hellwig Heuristic (CFSH) method and empirically showed that CFSH gives smaller classification errors that CFS. In this paper comparison between CFS, CFSH and modification of CFSH method based on optimization through genetic algorithms is presented. (original abstract)

Słowa kluczowe

Dobór zmiennych Modele dyskryminacyjne

Variables selection Discriminatory models

Czasopismo

Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Taksonomia

Rocznik

2007

Tom

Numer

nr 1169 Klasyfikacja i analiza danych - teoria i zastosowania

Strony

202--209

Opis fizyczny

Twórcy

autor

Andrzej Dudek

Akademia Ekonomiczna we Wrocławiu

autor

Adam Kurzydłowski

Akademia Ekonomiczna we Wrocławiu

Bibliografia

Breiman L. (1996), Bagging Predictors, "Machine Learning" 24, s. 123-140.
Breiman L. (2001), Random Forests,,Machine Learning" 45, s. 5-32.
Dudek A., Kurzydłowski A. (2006), Dobór zmiennych do zagregowanych modeli dyskryminacyjnych z wykorzystaniem algorytmów genetycznych, materiały z XXXII Konferencji Ekonometryków, Statystyków i Matematyków (w recenzji).
Gatnar E. (2001), Nieparametryczna metoda dyskryminacji i regresji. Wydawnictwo Naukowe PWN, Warszawa.
Gatnar E. (2003), O pewnej metodzie redukcji błędu klasyfikacji, "Prace Naukowe AE we Wrocławiu", nr 988, AE, Wrocław, s. 245-253.
Gatnar E. (2005), Dobór zmiennych do zagregowanych modeli dyskryminacyjnych, "Prace Naukowe AE we Wrocławiu" nr 1076, AE, Wrocław, s. 79-85.
Gatnar E., Walesiak M. (red.) (2004), Metody statystycznej analizy wielowymiarowej w badaniach marketingowych, AE, Wrocław.
Goldberg J. (2003), Algorytmy genetyczne i ich zastosowania, WNT, Warszawa.
Hall M. (2000), Correlation-based Feature Selection for Discrete and Numeric Machine Learning, [w:] Proceedings of the 17th International Conference on Machine Learning, Morgan Kaufmann, San Francisco.
Hellwig Z. (1969), O problemie optymalnego wyboru predykant, "Przegląd Statystyczny" 3-4.
Но Т.K. (1998), The Random Subspace Method for Constructing Decision Forests, "IEEE Transactions on Pattern Analysis and Machine Learning" 20, s. 832-844.
Theil H. (1972), Statistical Decomposition Analysis, North-Holland Publishing, Amsterdam.

Typ dokumentu

Bibliografia

Identyfikatory

Identyfikator YADDA

bwmeta1.element.ekon-element-000171478735

Komentarze

Musisz być zalogowany aby pisać komentarze.

Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Taksonomia

Porównanie metod doboru zmiennych do zagregowanych modeli dyskryminacyjnych

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane