PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2015 | nr 227 | 75--84
Tytuł artykułu

O odporności na obserwacje odstające wybranych nieparametrycznych modeli regresji

Treść / Zawartość
Warianty tytułu
Robustness for Outliers of Selected Nonparametric Regression Models
Języki publikacji
PL
Abstrakty
Artykuł jest poświęcony zagadnieniu odporności metod regresji na obserwacje odstające występujące w zbiorze danych. W pierwszej części przedstawiono wybrane metody identyfikacji obserwacji nietypowych. Następnie badano odporność trzech nieparametrycznych metod regresji: PPR, POLYMARS i RANDOM FORESTS. Analiz dokonano za pomocą procedur symulacyjnych na rzeczywistym zbiorze danych Mieszkania, w którym wykryto obserwacje odstające. Pomimo dosyć powszechnych przekonań o odporności regresji nieparametrycznej, okazało się, że modele zbudowane na całym zbiorze danych mają istotnie mniejsze zdolności predykcyjne niż modele uzyskane na zbiorze, z którego usunięto obserwacje nietypowe.(abstrakt oryginalny)
EN
The paper presents an important problem of robustness for outliers in regression. In the first part selected outliers detection techniques are described. Moreover, we empirically examine the robustness of the following methods: PPR, POLYMARS and RANDOM FORESTS on real world dataset. We show, that after removing outliers the prediction abilities of the models increase.(original abstract)
Rocznik
Numer
Strony
75--84
Opis fizyczny
Twórcy
  • Uniwersytet Ekonomiczny w Katowicach
Bibliografia
  • Breiman L. (2001), Random Forests, "Machine Learning", No. 45, s. 5-32.
  • Cook R.D. (1977), Detection of Influential Observations in Linear Regression, "Technometrics", No. 19 (1), s. 15-18.
  • Filzmoser P., Maronna R.A., Werner M. (2008), Outlier Identification in High Dimensions, "Computational Statistics & Data Analysis", no. 52, s. 1694-1711.
  • Friedman J., Stuetzle W. (1981), Projection Pursuit Regression, "Journal of the American Statistical Association", No. 76, s. 817-823.
  • Healy M. J. R. (1968), Multivariate Normal Plotting, "Applied Statistics", No. 17, s. 157-161.
  • Jajuga K. (1993), Statystyczna analiza wielowymiarowa, Wydawnictwo Naukowe PWN, Warszawa.
  • Kooperberg C., Bose S., Stone C. (1997), Polychotomous Regression, "Journal of the American Statistical Association", No. 92, s. 117-127.
  • Meyer D., Leisch F., Hornik K. (2003), The Support Vector Machine under Test, "Neurocomputing", Vol. 1-2, No. 55, s. 169-186.
  • Trzęsiok J. (2011), Przegląd metod regularyzacji w zagadnieniach regresji nieparametrycznej [w:] Jajuga K., Walesiak M., red., Taksonomia 18. Klasyfikacja i analiza danych, Wydawnictwo UE, Wrocław, s. 330-339.
  • Trzęsiok J. (2013), Wybrane symulacyjne techniki porównywania nieparametrycznych metod regresji [w:] Jajuga K., Walesiak M., red. Taksonomia 20. Klasyfikacja i analiza danych - teoria i zastosowania, Wydawnictwo UE, Wrocław, s. 197-205.
  • Trzpiot G. , red. (2013), Wybrane elementy statystyki odpornej, Wydawnictwo UE, Katowice.
  • Tukey J.W. (1977), Exploratory Data Analysis, Addison-Wesley.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171390253

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.