Czasopismo
Tytuł artykułu
Autorzy
Warianty tytułu
Stability of The Factor Probability Distance Clustering Method
Języki publikacji
Abstrakty
Czynnikowa metoda odległości probabilistycznej (Factor Probability Distance Clustering), tworząc liniową kombinację oryginalnych zmiennych, prowadzi do mniejszej liczby ortogonalnych czynników, a następnie dokonuje podziału obiektów przy zastosowaniu metody odległości probabilistycznej (Probability Distance Clustering). Metoda ta może w znaczący sposób poprawić dokładność rozpoznawania rzeczywistej struktury grup; ponadto w przypadku dużych zbiorów danych może się przyczynić do podniesienia stabilności rozwiązania. Głównym celem artykułu będzie zbadanie stabilności czynnikowej metody odległości probabilistycznej. Przyjęte w pracy kryterium stabilności można sformułować następująco: metodę grupowania uznaje się za stabilną, jeżeli uzyskane przy wielokrotnym jej zastosowaniu wyniki grupowania nie różnią się między sobą(abstrakt oryginalny)
Factorial clustering methods have been developed in recent years thanks to the improving of computational power. They have been proposed in order to cluster large datasets, where large is referred to the number of variables. The factor probability distance clustering method performs a linear transformation of original variables into a reduced number of orthogonal ones and in the next step it clusters transformed data by means of probability distance method. This method can significantly improve the algorithm performance; moreover large datasets can be partitioned into clusters with increasing stability of the results. The main aim of this article is a study of stability of the factor probability distance clustering method(original abstract)
Słowa kluczowe
Rocznik
Tom
Strony
176--183
Opis fizyczny
Twórcy
autor
- Uniwersytet Ekonomiczny w Katowicach
Bibliografia
- Dudoit S., Fridlyand J., 2003, Bagging to improve the accuracy of a clustering procedure, Bioinformatics, vol. 19, no. 9, s. 1090-1099.
- Frey B.J., Dueck D., 2007, Clustering by passing messages between data points, Science, vol. 315, no. 5814, s. 972-976.
- Gettler Summa M., Palumbo F., Tortora C., 2011, Factor PD-clustering, Working Paper, http://arxiv.org/abs/1106.3830 (3.07.2012).
- Hartigan J.A., Wong M.A., 1979, A K-means clustering algorithm, Applied Statistics vol. 28, no. 1, s. 100-108.
- Hornik K., 2005, A CLUE for CLUster ensembles, Journal of Statistical Software, vol. 14, no. 12, s. 65-72.
- https://archive.ics.uci.edu/ml/datasets.html.
- Israel A., Iyigun C., 2008, Probabilistic d-clustering, Journal of Classification, vol. 25, no. 1, s. 5-26.
- Kolda T.G., Bader B.W., 2008, Tensor decompositions and applications, SIAM Review, vol. 51, no. 3, s. 455-500.
- Kuncheva L.I., Vetrov D.P., 2006, Evaluation of stability of k-means cluster ensembles with respect to random initialization, IEEE Transactions on Pattern Analysis & Machine Intelligence, vol. 28, no. 11, s. 1798-1808.
- Lebart A., Morineau A., Warwick K., 1984, Multivariate Statistical Descriptive Analysis, John Wiley and Sons, New York.
- Leisch F., 1999, Bagged clustering, Adaptive Information Systems and Modeling in Economics and Management Science, Working Papers, SFB, no. 51.
- Rand W.M., 1971, Objective criteria for the evaluation of clustering methods, Journal of the American Statistical Association, vol. 66 (336), s. 846-850.
- Rozmus D., 2010, Porównanie stabilności zagregowanych algorytmów taksonomicznych opartych na macierzy współwystąpień, Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu, nr 176, Taksonomia 18: Klasyfikacja i analiza danych - teoria i zastosowania, s. 212-220.
- Rozmus D., 2012, Porównanie dokładności spektralnej oraz zagregowanych algorytmów opartych na idei metody bagging, Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu, nr 242, Taksonomia 19: Klasyfikacja i analiza danych - teoria i zastosowania, s. 352-360.
- Rozmus D., 2013, Porównanie dokładności taksonomicznej metody propagacji podobieństwa oraz zagregowanych algorytmów taksonomicznych opartych na idei metody bagging, Prace Naukowe, Uniwersytetu Ekonomicznego we Wrocławiu, nr 279, Taksonomia 21: Klasyfikacja i analiza danych - teoria i zastosowania, s. 140-152.
- Tucker L.R., 1966, Some mathematical notes on three-mode factor analysis, Psychometrika, vol. 31, no. 3, s. 279-311.
- Vichi M., Kiers H., 2001, Factorial k-means analysis for two way data, Computational Statistics and Data Analysis, vol. 37, no. 1, s. 29-64.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171438350