PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2005 | 12 | nr 1076 Klasyfikacja i analiza danych - teoria i zastosowania | 106--118
Tytuł artykułu

Problemy selekcji i ważenia zmiennych w zagadnieniu klasyfikacji

Autorzy
Warianty tytułu
Variable Selection and Weighting Problems in Cluster Analysis
Języki publikacji
PL
Abstrakty
W artykule, głównie na przykładzie wygenerowanych danych w dwuwymiarowej przestrzeni zmiennych, wskazano ograniczenia, które należy wziąć pod uwagę przy selekcji zmiennych w zagadnieniu klasyfikacji. W niektórych sytuacjach jest możliwe uogólnienie na większą liczbę wymiarów. W przeprowadzonych eksperymentach wykorzystano procedurę NtRandLMultiNorm z programu NtRand 2.01, generującą liczby losowe odpowiednie do zadanych wektorów średnich i macierzy kowariancji. W artykule zakładać będziemy, że zmienne opisujące obiekty badania są mierzone na skali przedziałowej lub ilorazowej. (fragment tekstu)
EN
Choice of variables is the one of the most important steps in a cluster analysis. Variables used in applied clustering should be selected and weighted carefully. In cluster analysis we should include only those variables that are believed to help discriminate the data.
In article:
- main aspects of selection and weighting of variables to cluster were characterised,
- point at limitations of variable selection for cluster analysis based on data generated from normal distribution,
- main approaches to variable selection and weighting for cluster analysis were discussed. (original abstract)
Twórcy
  • Akademia Ekonomiczna we Wrocławiu
Bibliografia
  • Carmone F.J., Kara A., Maxwell S., HINoV: a New Method to Improve Market Segment Definition by Identifying Noisy Variables, "Journal of Marketing Research" 1999, listopad, vol. 36, s. 501-509.
  • Desarbo W.S., Carroll J.D., Clark L.A., Green P.E., Synthesized Clustering: a Method for Amalgamating Clustering Bases with Differential Weighting of Variables "Psychometrika" 1984, vol. 49, nr 1, s. 57-78.
  • De Soete G., Optimal Variable Weighting for Ultrametric and Additive Tree Clustering, "Quality & Quantity" 1986,20, s. 169-180.
  • De Soete G., OVWTRE: a Program for Optimal Variable Weighting for Ultrametric and Additive Tree Fitting, "Journal of Classification" 1988, vol. 5, s. 101-104.
  • Fowlkes E.B., Gnanadesikan R., Kettenring J.R., Variable Selection in Clustering and other Contexts, [w:] Design, Data, and Analysis, red. C.L. Mallows, Wiley, New York, Toronto 1987.
  • Fowlkes E.B., Gnanadesikan R., Kettenring J.R., Variable Selection in Clustering, "Journal of Classification" 1988, vol. 5, s. 205-228.
  • Friedman J.H., Meulman J.J., Clustering Objects on Subsets Attributes, http://www-stat.stanford.edu/~jhf/ftp/cosa.pdf, 2004.
  • Gnanadesikan R., Kettenring J.R., Tsao S.L., Weighting and Selection of Variables for Cluster Analysis, "Journal of Classification" 1995, vol. 12, s. 113-136.
  • Gordon A.D., Classification, Chapman and Hall/CRC, London 1999.
  • Grabiński T., Metody taksonometrii, AE, Kraków 1992.
  • Guyon I., Elisseeff A., An Introduction to Variable and Feature Selection, "Journal of Machine Learning Research" 2003,3, s. 1157-1182.
  • Hubert L.J., Arabie P., Comparing Partitions, "Journal of Classification" 1985, nr 1, s. 193-218.
  • Krieger A.M., Green P.E., A Generalized Rand-Index Method for Consensus Clustering of Separate Partitions of the Same Data Base, "Journal of Classification" 1999, nr 1, s. 63-89.
  • Makarenkov V., Legendre P., Optimal Variable Weighting for Ultrametric and Additive Trees and K-Means Partitioning Methods and Software, "Journal of Classification" 2001, vol. 18, s. 245-271.
  • Milligan G.W., A Validation Study of a Variable Weighting Algorithm for Cluster Analysis, "Journal of Classification" 1989, vol. 6, s. 53-71.
  • Milligan G.W., Issues in Applied Classification: Selection of Variables to Cluster, Classification Society of North America Newsletter, listopad, Issue 37, 1994.
  • Milligan G.W., Clustering Validation: Results and Implications for Applied Analyses, [w:] Clustering and Classification, red. P. Arabie, L.J. Hubert, G. de Soete, World Scientific, Singapore 1996, s. 341-375.
  • Rand W.M., Objective Criteria for the Evaluation of Clustering Methods, "Journal of the American Statistical Association" 1971, nr 336, s. 846-850.
  • Sokołowski A., Empiryczne testy istotności w taksonomii, "Zeszyty Naukowe AE w Krakowie", seria specjalna: Monografie nr 108, AE, Kraków 1992.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171525995

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.