PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2012 | nr 227 | 157--175
Tytuł artykułu

Probabilistyczne łączenie rekordów jako metoda łączenia baz danych zawierających informacje o tych samych jednostkach

Autorzy
Treść / Zawartość
Warianty tytułu
Probabilistic Record Linkage as a Method of Merging Databases Containing Information about the Same Units
Języki publikacji
PL
Abstrakty
Rosnący popyt na "wielowymiarową" informację statystyczną na niskim poziomie agregacji przestrzennej powoduje, że w statystyce publicznej coraz częściej wykorzystywane są rejestry administracyjne. Pochodzące z różnych resortów rejestry obejmują bardzo dużą ilość informacji na temat różnorodnych dziedzin społeczno-ekonomicznych w kraju. Połączenie rejestrów pochodzących od różnych gestorów umożliwiłoby uzyskanie kompleksowej informacji na każdy temat w dowolnym przekroju przestrzennym i merytorycznym. Łączenie rejestrów najczęściej odbywa się z wykorzystaniem unikatowego klucza połączeniowego, jakim może być np. PESEL lub NIP. Zdarzające się niekiedy błędy w zapisie lub wręcz usunięcie takiej zmiennej z rejestru (np. w celu zachowania tajemnicy statystycznej) czyni łączenie zbiorów danych niemożliwym. Rozwiązaniem tego typu problemów wydają się statystyczne metody integracji danych, wśród których wyróżnia się probabilistyczne łączenie rekordów (probabilistic record linkage). Metody te umożliwiają integrację baz danych zawierających informację o tych samych jednostkach, nieposiadających wspólnego, unikatowego klucza połączeniowego. (abstrakt oryginalny)
EN
Growing demand for "multidimensional" statistical information, at a low level of spatial aggregation causes that in official statistics administrative registers are being increasingly used. Registers from various departments cover a very large amount of information on various socio-economic areas of the country. Combining records from different sources allows to obtain comprehensive information on any topic at any spatial and content section. Integration of registers integration is usually done using a unique key, like, for example Social Security or Tax ID. Errors in these records or even the removal of such a variable from the registry (e.g. for statistical confidentiality) makes it impossible to combine data sets. The solution to these problems seems to be statistical methods for data integration, among which probabilistic record linkage is distinguished. These methods allow the integration of databases containing information on the same units, with no common unique key. (original abstract)
Rocznik
Numer
Strony
157--175
Opis fizyczny
Twórcy
  • Uniwersytet Ekonomiczny w Poznaniu
Bibliografia
  • Belin, T.R., Rubin, D.B., 1995, A Method for Calibrating False-match Rates in Record Linkage, Journal of the American Statistical Association, vol. 90.
  • Bernier, J., 1997, Quantitative Evaluation of the Linkage Operations of the 1996 Census Reverse Record Check, w: Record Linkage Techniques, Federal Committee on Statistical Methodology, Office of Management and Budget, Washington, DC.
  • Bhattacharya, I., Getoor, L., 2004, Iterative Record Linkage for Cleaning and Integration, Department of Computer Science, University of Maryland, College Park.
  • Blakely, T., Salmond, C., 2002, Probabilistic Record Linkage and a Method to Calculate the Positive Predictive Value, International Journal of Edidemiology, vol. 31.
  • Cibella, N., Scanu, M., Tuoto, T., 2008, Quality Assessments, w: ESSnet Statistical Methodology Project on Integration of Survey and Administrative Data. Report of WP1. State of the Art on Statistical Methodologies for Integration of Surveys and Administrative Data.
  • Data Integration Manual, 2006, pr. zbior., Statistics New Zealand, Wellington.
  • Dempster, A., Laird, N., Rubin, D., 1977, Maximum Likelihood from Incomplete Data via the EM Algorithm, Journal of the Royal Statistical Society. Series B Methodological, vol. 39, no. 1.
  • Fellegi, I., 1997, Record Linkage and Public Policy - a Dynamic Resolution, w: Record Linkage Techniques, Federal Committee on Statistical Methodology, Office of Management and Budget, Washington, DC.
  • Fellegi, I., Sunter, A., 1969, A Theory for Record Linkage, Journal of the American Statistical Association, American Statistical Association, vol. 64, no. 328, Washington DC.
  • Gill, L., 2001, Methods for Automatic Record Matching and Linkage and their use in National Statistics, National Statistics Methodological Series, no. 25, National Statistics, United Kingdom.
  • Hogan, H., Wolter, K., 1998, Measuring Accuracy in a Post-enumeration Survey, Survey Methodology, vol. 14.
  • Jaro, M. A., 1989, Advances In Record Linkage Methodology as Applied to Matchning the 1985 Census of Tampa, Florida, Journal of the American Statistical Association, no.
  • Lynch, M., Winkler, W., 1993, Improved String Comparator, Technical Report, Statistical Research Division, Washington, DC: U.S. Bureau of the Census.
  • McLaughlin, G., 1993, Private Communication of C-String-Comparison Routine, maszynopis.
  • Nitz, L., Kim, K., 1997, Investigating Auto Injury Treatment in a No-Fault State: An Analysis of Linked Crash and Auto Insurer Data, w: Record Linkage Techniques, Federal Committee on Statistical Methodology, Office of Management and Budget, Washington, DC.
  • Porter, E., Winkler, W., 1997, Approximate String Comparison and its Effect on an Advanced Record Linkage System, w: Record Linkage Techniques, Federal Committee on Statistical Methodology, Office of Management and Budget, Washington, DC.
  • Torelli, N., Paggiaro, A., 1999, Una procedura per I'abbinamento di record nella rilevazione trimestrale delie forze di lavoro, maszynopis.
  • Ustawa z dnia 17 lutego 2005 r. o informatyzacji działalności podmiotów realizujących zadania publiczne [Dz.U., nr 64, poz. 565, z późn. zm.].
  • Wallman, K., Coffey, J., 1997, Sharing Statistical Information for Statistical Purposes, w: Record Linkage Techniques, Federal Committee on Statistical Methodology, Office of Management and Budget, Washington, DC.
  • Winkler, W., 1990, String Comparator Metrics and Enhanced Decision Rules in the Fellegi-Sunter Model of Record Linkage, Proceedings of the Section on Survey Research Methods, American Statistical Association.
  • Winkler, W., 2005, Overview of Record Linkage and Current Research Directions, U.S. Bureau of the Census, Washington.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171214157

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.