Modification of Talavera Method of Variable Selection in Cluster Analysis

Korzeniewski, Jerzy

Artykuł - szczegóły

Czasopismo

Acta Universitatis Lodziensis. Folia Oeconomica

2013 | 285 Multivariate Statistical Analysis Theory and Practice | 79--88

Tytuł artykułu

Modification of Talavera Method of Variable Selection in Cluster Analysis

Autorzy

Jerzy Korzeniewski

Warianty tytułu

Badanie efektywności modyfikacji metody Talavery wybierania zmiennych w analizie skupień na empirycznych zbiorach danych

Języki publikacji

Abstrakty

Talavera has proposed a method of variable selection in cluster analysis for data sets in which only variables measured on nominal scale are present. He examined the method on a couple of data sets basing his assessment on the case in which one can use a data grouping algorithm (he used the COBWEB algorithm). In other approaches some authors try to select variables without referring to any particular grouping method. In the paper, we investigate the efficiency of the Talavera method on real world data sets, referring only to the succession of variables and the greatest jump criterion. Some data sets with variables measured on stronger scales are also investigated after previous descretization. (original abstract)

Talavera zaproponował metodę wybierania zmiennych tworzących strukturę skupień w zbiorze danych dla zbiorów, w których występują tylko zmienne mierzone na skali nominalnej. Autor zbadał tę metodę na kilku empirycznych zbiorach opierając ocenę na tym jak spisywała się metoda w połączeniu z ustalonym sposobem grupowania danych (algorytm COBWEB). W innych podejściach do tego samego zagadnienia autorzy starają się oprzeć wybór zmiennych na samym uporządkowaniu zbioru zmiennych bez odwoływania się do grupowania obserwacji. W artykule badana jest efektywność metody również w odniesieniu do empirycznych zbiorów danych, uzależniona tylko od uporządkowania zmiennych, oparta na kryterium największego skoku. Rozważane są również zbiory z niektórymi zmiennymi mierzonymi na mocniejszych skalach z po uprzedniej dyskretyzacji zmiennych. (abstrakt oryginalny)

Słowa kluczowe

Statistical methods Cluster analysis Set theory

Metody statystyczne Analiza skupień Teoria zbiorów

Czasopismo

Acta Universitatis Lodziensis. Folia Oeconomica

Rocznik

2013

Tom

285 Multivariate Statistical Analysis Theory and Practice

Strony

79--88

Opis fizyczny

Twórcy

autor

Jerzy Korzeniewski

University of Lodz, Poland

Bibliografia

Dietterich, T. G., (1998). Approximate Statistical Tests for Comparing Supervised Classification Learning Algorithms, Neural Computation, 10.
Fisher D., (1987), Knowledge acquisition via incremental conceptual clustering, PhD. Thesis, University of California, Irvine.
Talavera L., (2000), Dependency-Based Feature Selection for Clustering Symbolic Data, Intelligent Data Analysis 4.

Typ dokumentu

Bibliografia

Identyfikatory

Identyfikator YADDA

bwmeta1.element.ekon-element-000171257267

Komentarze

Musisz być zalogowany aby pisać komentarze.

Acta Universitatis Lodziensis. Folia Oeconomica

Modification of Talavera Method of Variable Selection in Cluster Analysis

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane