Warianty tytułu
Data Imputation in Censuses
Języki publikacji
Abstrakty
W artykule są przedstawione wyniki symulacyjnego eksperymentu obliczeniowego, polegającego na imputacji brakujących danych zbieranych w spisach powszechnych. Istotne znaczenie w rozpatrywanej metodzie mają dwa elementy - taksonomiczne grupowanie rekordów z dostępnymi danymi na jednorodne skupienia oraz metoda "ruletki statystycznej". W celu oceny przydatności metodologii wykorzystano dane zgromadzone podczas Narodowego Spisu Powszechnego Ludności i Mieszkań przeprowadzonego w 2002 r. dla gminy Gołuchów w powiecie pleszewskim w Wielkopolsce.
Results of a simulation experiment aimed at an appraisal of utility of some original model of data imputation in censuses are presented in the paper. It is based on clustering of records-donors according to their similarity and on the method of statistical roulette, i.e. a rotational algorithm arranging to records receives the lacking data in a random way from the nearest homogeneous donor clusters. The exercise, which showed high efficiency of the applied attempt, was performed using data for the gmina Gołuchów in the Wielkopolska region collected during the National Population and Housing Census conducted in 2002. (original abstrakt)
Twórcy
autor
- Urząd Statystyczny w Poznaniu
Bibliografia
- Florek K., Łukaszewicz J., Perkal J., Steinhaus H., Zubrzycki S. (1951), Taksonomia wrocławska, "Przegląd Antropologiczny", t. XVII.
- Kalton G., Kasprzyk D. (1982), Imputing for Missing Survey Responses, Proceedings of the Survey Research Methods Section, American Statistical Association (http://www.amstat.org/sections/SRMS/Proceedings/papers/1982_004.pdf).
- Kalton G., Kasprzyk D. (1986), The treatment of missing survey data, "Survey Methodology", vol. 12, nr 1.
- Lance G. N., Williams W. T. (1967), A General Theory of Classificatory Sorting Strategies. I. Hierachical Systems, "Computer Journal", vol. 9.
- Milligan G. (1989), A study of the beta-flexible clustering method, "Multivariate Behavioral Research", vol. 24.
- Młodak A. (2006 a), Analiza taksonomiczna w statystyce regionalnej, Centrum Doradztwa i Informacji DIFIN, Warszawa.
- Młodak A. (2006 b), Multilateral normalisations of diagnostic features, "Statistics in Transition", vol. 7, No. 5.
- Młodak A. (2009), Historia problemu Webera, "Matematyka Stosowana", vol. 10/51.
- Piasecki T., Cybart D., Kubacki J. (2009), Metodologiczne problemy imputacji danych w PSR 2010, Urząd Statystyczny w Łodzi, maszynopis.
- Rubin D. B. (1987), Multiple Imputation for Nonresponse in Surveys, New York, John Wiley & Sons.
- Stefanowicz B. (2009), Imputacja danych statystycznych, maszynopis.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000169133326