Czasopismo
Tytuł artykułu
Autorzy
Warianty tytułu
Efficiency of Selected Methods for Imputation of Incomplete Data and Different Missing Data Mechanisms
Języki publikacji
Abstrakty
W niniejszym artykule zostaną porównane trzy metody: metoda MI (multiple imputation), metoda SI-EM (single imputation), wykorzystująca algorytm EM, oraz metoda SOM (self-organized map). Dwie pierwsze należą do metod parametrycznych, zakładających, że próbka pochodzi z populacji o wielowymiarowym rozkładzie normalnym, trzecia - do metod nieparametrycznych, w których nie zakłada się postaci rozkładu. Jako implementację procedury MI wykorzystano algorytm zawarty w pakiecie analitycznym SAS, procedury SI-EM - moduł MVA z pakietu SPSS, z kolei implementacja SOM pochodzi z pakietu opracowanego i udostępnionego przez zespół kierowany przez autora metody. Artykuł ten stanowi kontynuację badań autora dotyczących oceny właściwości metody SOM w analizie danych niekompletnych o charakterze przekrojowym. (fragment tekstu)
Incomplete data, issue addressed by various authors, constitute a serious problem for many classical data analysis methods. The concept of utilizing SOM neural network (Kohonen 1995) as an effective technique for handling data vectors containing missing components was presented in the previous papers of the author. The following article compares SOM with other advanced missing data handling methods across different missing data mechanisms (Little, Rubin 1987): MCAR, MAR and NMAR. Artificially created multidimensional random data sets with various predefined distributions will be the basis for this comparison. (original abstract)
Słowa kluczowe
Rocznik
Tom
Strony
471--477
Opis fizyczny
Twórcy
autor
- Akademia Ekonomiczna w Krakowie
Bibliografia
- Grabiński T., Wydymus S., Zeliaś A., Z badań nad metodami predykacji brakujących informacji, "Zeszyty Naukowe AE w Krakowie", nr 114, Kraków 1979, s. 31-60.
- Grabowski M., Application of Self-Organizing Maps to Outlier Identification and Estimation of Missing Data, [w:] Advances in Data Science and Classification, red. A. Rizzi, M. Vichi, H.H. Bock, Springer, Berlin 1998, s. 279-286.
- Grabowski M., Sieć Kohonena jako metoda szacowania brakujących danych, "Zeszyty Naukowe AE w Krakowie", nr 522, Kraków 1999, s. 37-52.
- Grabowski M., Handling Missing Values in Marketing Research Using SOM, [w:] Innovations in Classification, Data Science, and Information Systems, red. D. Baier, K.-D. Wernecke, Proc. 27th Annual GfKl Conference, University of Cottbus, 12-14 marca 2003, Springer-Verlag, Heidelberg-Berlin 2004, s. 322-329.
- Hesterberg T., A Graphical Representation of Little's Test for MCAR, MathSoft, Research Report nr 94, 1999, http://www.statsci.com/Hesterberg/articles/tech94-mi-little.ps.
- Kohonen T., Self-Organizing Maps, Springer-Verlag, Berlin 1995.
- Kohonen T., Hynninen J., Kangas J., Laaksonen J., SOMJPAK The Self- Organizing Map Program Package Version 3.1, University of Technology, Helsinki 1995, http://www.cis.hut.fi/researcli/som_pak/.
- Kordos J., Jakość danych statystycznych, PWE, Warszawa 1998.
- Little R.J.A., A Test of Missing Completely at Random for Multivariate Data with Missing Values, "Journal of the American Statistical Association" 1988, 83(4), s. 1198-1202.
- Little R.J.A., Rubin D.A., Statistical Analysis with Missing Data, John Wiley & Sons, New York 2002.
- Pawełek В., Metody szacowania brakujących informacji w szeregach przekrojowo-czasowych, niepublikowana praca doktorska, AE, Kraków 1996.
- Schafer J.L., Analysis of Incomplete Multivariate Data, Chapman & Hall, London 1997.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171526519