PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2018 | 19(XIX) | nr 3 | 263--273
Tytuł artykułu

Zastosowanie analizy skupień i lasów losowych w klasyfikacji gmin w Polsce na skali poziomu rozwoju społeczno-gospodarczego

Autorzy
Treść / Zawartość
Warianty tytułu
Using Cluster Analysis and Technique of Random Forests in the Classification of Communes in Poland on the Scale of Socio-Economic Development
Języki publikacji
PL
Abstrakty
W artykule przedstawiono algorytm klasyfikacji gmin na skali poziomu rozwoju społeczno-gospodarczego. Algorytm ten obejmuje cztery etapy: (1) dobór i redukcja zmiennych, (2) konstrukcja miernika syntetycznego i uszeregowanie liniowe gmin na skali poziomu rozwoju społeczno-gospodarczego, (3) grupowanie gmin metodą analizy skupień wg algorytmu k-średnich na podstawie wartości miernika syntetycznego, (4) weryfikacja klasyfikacji metodą lasów losowych. W wyniku procedury klasyfikacyjnej zidentyfikowano dywergencję rozwoju społeczno-gospodarczego w Polsce.
EN
The article presents the algorithm of classification of communes on the scale of socio-economic development level. The algorithm includes four steps: (1) selection and reduction of variables, (2) construction of a synthetic measure and linear ordering of communes on the scale of socio-economic development level, (3) grouping of communes by cluster analysis (k-means algorithm) based on the synthetic measure, (4) verification of classification using the random forests method. As a result of the classification procedure was identified the progressive divergence of socio15 economic development in Poland.(original abstract)
Twórcy
  • Uniwersytet im. Adama Mickiewicza w Poznaniu
Bibliografia
  • Bray J. R., Curtis J. T. (1957) An Ordination of the Upland Forest Communities of Southern Wisconsin. Ecological Monographs, 27(4), 325-349.
  • Breiman L. (2001) Random Forests. Machine Learning, 45, 5-32.
  • Breiman L., Friedman J. H., Olshen R. A., Stone C. J. (1998) Classification and Regression Trees (CART). Chapman and Hall, CRC Press reprint.
  • Burton I. (1963) The Quantitative Revolution and Theoretical Geography. Canadian Geographer, 7(4), 151-162.
  • Chen C., Liaw A., Breiman L. (2004) Using Random Forest to Learn Imbalanced Data. Technical Report 666, Statistics Department, University of California at Berkeley.
  • Chojnicki Z. (1985) Orientacje filozoficzno-metodologiczne geografii - ich koncepcje i modele. Przegląd Geograficzny, 57(3), 255-281.
  • Chojnicki Z., Czyż T. (1973) Metody taksonomii numerycznej w regionalizacji geograficznej. PWN, Warszawa.
  • Duranton G., Henderson J. V., Strange W. C. (Eds.) (2015) Handbook of Regional and Urban Economics. 5A/5B, North-Holland.
  • Hastie T., Tibshirani R., Friedman J. (2013) The Elements of Statistical Learning Data Mining, Inference and Prediction. Second Edition. Springer.
  • Hartigan J. (1975) Clustering Algorithms. John Wiley & Sons.
  • Jańczak J. (2015) Phantom Borders and Electoral Behaviour in Poland. Historical Legacies, Political Culture and Their Influence on Contemporary Politics. Erdkunde, 69(2), 125-137.
  • Kaufman L., Rousseeuw P. J. (1990) Finding Groups in Data. An Introduction to Cluster Analysis. Wiley-Interscience.
  • Mój region, moja Europa, nasza przyszłość: siódme sprawozdanie w sprawie spójności gospodarczej, społecznej i terytorialnej (2017) Bruksela, 9.10.2017, COM(2017) 583.
  • Nijkamp P. (Ed.) (1986) Handbook of Regional and Urban Economics. Volume I. Regional Economics. North-Holland.
  • Powers D. M. W. (2011) Evaluation: from Precision, Recall and F-Measure to ROC, Informedness, Markedness & Correlation. Journal of Machine Learning Technologies, 2(1), 37-63.
  • Sobczyński M. (2008) Polskie doświadczenia w zakresie badania granic reliktowych i krajobrazu pogranicza. [w:] Kulesza M. (red.) Czas i przestrzeń w naukach geograficznych: wybrane problemy geografii historycznej. Wyd. UŁ, Łódź, 66-78.
  • Walesiak M. (2016) Wybór grup metod normalizacji wartości zmiennych w skalowaniu wielowymiarowym. Przegląd Statystyczny, 63(1), 7-18.
  • Zeliaś A. (2002) Uwagi na temat wyboru metody normowania zmiennych diagnostycznych. [w:] Kufel T., Piłatowska M. (red.) Analiza szeregów czasowych na początku XXI wieku. Wyd. UMK, Toruń.
Typ dokumentu
Bibliografia
Identyfikator YADDA
bwmeta1.element.ekon-element-000171542006

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.