PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2014 | 22 | nr 327 Klasyfikacja i analiza danych - teoria i zastosowania | 157--166
Tytuł artykułu

Wybrane metody identyfikacji obserwacji oddalonych

Treść / Zawartość
Warianty tytułu
Selected Methods for Outlier Detection
Języki publikacji
PL
Abstrakty
W artykule podjęto próbę uporządkowania definicji obserwacji oddalonych. Zestawiono kilka, znacząco różniących się podejściem do problemu, metod identyfikacji obserwacji oddalonych: jednowymiarową metodę kwartylową, krzywe Andrewsa, metodę bazującą na odległości Mahalonobisa, metodę uwzględniającą lokalne zagęszczenie obser-wacji, metodę wektorów nośnych. Ponadto sprawdzono empirycznie, w jakim stopniu wy-brane metody pokrywają się we wskazaniach obserwacji oddalonych. Część empiryczną przeprowadzono na zbiorze danych [Diagnoza społeczna 2011].(abstrakt oryginalny)
EN
In the paper we try to set in order different definitions of outliers. We also col-late a few selected outlier detection techniques, which represent very different approaches to outliers identification: classical univariate method embodied in boxplots, Andrews' curves, methods based on Mahalonobis distance, local outlier factor method, support vector ma-chines. Moreover, we empirically examine the agreement between the results of outlier de-tection methods on the demanding dataset Social Diagnosis 2011(original abstract)
Twórcy
  • Uniwersytet Ekonomiczny w Katowicach
Bibliografia
  • Andrews D.F. (1972), Plots of High-Dimensional Data, Biometrics, vol. 28, 1, s. 125-136.
  • Barnett V., Lewis T. (1998), Outliers in Statistical Data, 3rd Edition, John Wiley & Sons, New York.
  • Ben-Hur A., Horn D., Siegelman H. T., Vapnik V. (2001), Support Vector Clustering, Journal of Machine Learning Research, 2, s. 125-137.
  • Breunig M.M., Kriegel H.-P., Ng R.T., Sander J. (2000), LOF: Identifying Density-Based Outliers, Proc. 29th ACM SIDMOD Int. Conf. on Management of Data, s. 93-104.
  • Diagnoza społeczna (2011), Diagnoza społeczna: zintegrowana baza danych, Rada Monitoringu Społecznego, www.diagnoza.com (24.02.2013).
  • Filzmoser P., Maronna R.A., Werner M. (2008), Outlier Identification in High Dimensions, Computa-tional Statistics & Data Analysis, 52, s. 1694-1711.
  • Giudici P. (2003), Applied Data Mining: Statistical Methods for Business and Industry, John Wiley & Sons, Southern Gate, Chichester.
  • Hawkins D. (1980), Identification of Outliers, Chapman and Hall, London - New York.
  • Healy M.J.R. (1968), Multivariate Normal Plotting, Applied Statistics, 17, s. 157-161.
  • Huber P.J., Ronchetti E.M. (2009), Robust Statistics, Second Edition, John Wiley & Sons, Hoboken, New Jersey.
  • Maddala G.S. (2006), Ekonometria, Wydawnictwo Naukowe PWN, Warszawa.
  • Rousseeuw P.J. (1984), Least Median of Squares Regression, Journal of the American Statistical Association, 79, s. 871-880.
  • Rousseeuw P.J., Leroy A.M. (2003), Robust Regression and Outlier Detection, John Wiley & Sons, New York.
  • Tukey J.W. (1977), Exploratory Data Analysis, Addison-Wesley, Southern Gate, Chichester.
  • Webb A.R. (2002), Statistical Pattern Recognition, Second Edition, John Wiley & Sons, Chichester.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171282411

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.