Zastosowanie analizy skupień i lasów losowych w klasyfikacji gmin w Polsce na skali poziomu rozwoju społeczno-gospodarczego

Perdał, Robert

doi:https://doi.org/10.22630/MIBE.2018.19.3.24

Artykuł - szczegóły

Czasopismo

Metody Ilościowe w Badaniach Ekonomicznych / Szkoła Główna Gospodarstwa Wiejskiego

2018 | 19(XIX) | nr 3 | 263--273

Tytuł artykułu

Zastosowanie analizy skupień i lasów losowych w klasyfikacji gmin w Polsce na skali poziomu rozwoju społeczno-gospodarczego

Autorzy

Robert Perdał

Treść / Zawartość

Pełne teksty:

http://qme.sggw.pl/pdf/MIBE_T19_z3.pdf [zdalny]

Warianty tytułu

Using Cluster Analysis and Technique of Random Forests in the Classification of Communes in Poland on the Scale of Socio-Economic Development

Języki publikacji

Abstrakty

W artykule przedstawiono algorytm klasyfikacji gmin na skali poziomu rozwoju społeczno-gospodarczego. Algorytm ten obejmuje cztery etapy: (1) dobór i redukcja zmiennych, (2) konstrukcja miernika syntetycznego i uszeregowanie liniowe gmin na skali poziomu rozwoju społeczno-gospodarczego, (3) grupowanie gmin metodą analizy skupień wg algorytmu k-średnich na podstawie wartości miernika syntetycznego, (4) weryfikacja klasyfikacji metodą lasów losowych. W wyniku procedury klasyfikacyjnej zidentyfikowano dywergencję rozwoju społeczno-gospodarczego w Polsce.

The article presents the algorithm of classification of communes on the scale of socio-economic development level. The algorithm includes four steps: (1) selection and reduction of variables, (2) construction of a synthetic measure and linear ordering of communes on the scale of socio-economic development level, (3) grouping of communes by cluster analysis (k-means algorithm) based on the synthetic measure, (4) verification of classification using the random forests method. As a result of the classification procedure was identified the progressive divergence of socio15 economic development in Poland.(original abstract)

Słowa kluczowe

Analiza skupień Rozwój społeczno-gospodarczy Gmina

Cluster analysis Social economic development District

Czasopismo

Metody Ilościowe w Badaniach Ekonomicznych / Szkoła Główna Gospodarstwa Wiejskiego

Rocznik

2018

Tom

19(XIX)

Numer

nr 3

Strony

263--273

Opis fizyczny

Twórcy

autor

Robert Perdał

Uniwersytet im. Adama Mickiewicza w Poznaniu

Bibliografia

Bray J. R., Curtis J. T. (1957) An Ordination of the Upland Forest Communities of Southern Wisconsin. Ecological Monographs, 27(4), 325-349.
Breiman L. (2001) Random Forests. Machine Learning, 45, 5-32.
Breiman L., Friedman J. H., Olshen R. A., Stone C. J. (1998) Classification and Regression Trees (CART). Chapman and Hall, CRC Press reprint.
Burton I. (1963) The Quantitative Revolution and Theoretical Geography. Canadian Geographer, 7(4), 151-162.
Chen C., Liaw A., Breiman L. (2004) Using Random Forest to Learn Imbalanced Data. Technical Report 666, Statistics Department, University of California at Berkeley.
Chojnicki Z. (1985) Orientacje filozoficzno-metodologiczne geografii - ich koncepcje i modele. Przegląd Geograficzny, 57(3), 255-281.
Chojnicki Z., Czyż T. (1973) Metody taksonomii numerycznej w regionalizacji geograficznej. PWN, Warszawa.
Duranton G., Henderson J. V., Strange W. C. (Eds.) (2015) Handbook of Regional and Urban Economics. 5A/5B, North-Holland.
Hastie T., Tibshirani R., Friedman J. (2013) The Elements of Statistical Learning Data Mining, Inference and Prediction. Second Edition. Springer.
Hartigan J. (1975) Clustering Algorithms. John Wiley & Sons.
Jańczak J. (2015) Phantom Borders and Electoral Behaviour in Poland. Historical Legacies, Political Culture and Their Influence on Contemporary Politics. Erdkunde, 69(2), 125-137.
Kaufman L., Rousseeuw P. J. (1990) Finding Groups in Data. An Introduction to Cluster Analysis. Wiley-Interscience.
Mój region, moja Europa, nasza przyszłość: siódme sprawozdanie w sprawie spójności gospodarczej, społecznej i terytorialnej (2017) Bruksela, 9.10.2017, COM(2017) 583.
Nijkamp P. (Ed.) (1986) Handbook of Regional and Urban Economics. Volume I. Regional Economics. North-Holland.
Powers D. M. W. (2011) Evaluation: from Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation. Journal of Machine Learning Technologies, 2(1), 37-63.
Sobczyński M. (2008) Polskie doświadczenia w zakresie badania granic reliktowych i krajobrazu pogranicza. [w:] Kulesza M. (red.) Czas i przestrzeń w naukach geograficznych: wybrane problemy geografii historycznej. Wyd. UŁ, Łódź, 66-78.
Walesiak M. (2016) Wybór grup metod normalizacji wartości zmiennych w skalowaniu wielowymiarowym. Przegląd Statystyczny, 63(1), 7-18.
Zeliaś A. (2002) Uwagi na temat wyboru metody normowania zmiennych diagnostycznych. [w:] Kufel T., Piłatowska M. (red.) Analiza szeregów czasowych na początku XXI wieku. Wyd. UMK, Toruń.

Typ dokumentu

Bibliografia

Identyfikatory

DOI

https://doi.org/10.22630/MIBE.2018.19.3.24

Identyfikator YADDA

bwmeta1.element.ekon-element-000171542006

Komentarze

Musisz być zalogowany aby pisać komentarze.

Metody Ilościowe w Badaniach Ekonomicznych / Szkoła Główna Gospodarstwa Wiejskiego

Zastosowanie analizy skupień i lasów losowych w klasyfikacji gmin w Polsce na skali poziomu rozwoju społeczno-gospodarczego

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane