PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2007 | 206 Methods of Multivariate Statistical Analysis and Their Applications | 167--176
Tytuł artykułu

Discrimination of Symbolic Objects

Autorzy
Warianty tytułu
Dyskryminacja obiektów symbolicznych
Języki publikacji
EN
Abstrakty
EN
Symbolic Data Analysis is an extension of multivariate analysis dealing with data represented in an extended form. Each cell in symbolic data table (symbolic variable) can contain data in form of single quantitative value, categorical value, interval, multivalued variable, multivalued variable with weights. Variable can be taxonomic, hierarchically dependent, logically dependent. Due to extended data representation Symbolic Data Analysis introduces new methods and also implements traditional methods that symbolic data can be treated as an input. Article shows how "classical" Bayesian discrimination rule can be adapted to deal with data of different symbolic types, presents kernel intensity measures for symbolic data and methods of obtaining probabilities of belongings to the classes. The example of using symbolic discriminant analysis for electronic mail filtering is given. (original abstract)
Symboliczna analiza danych jest rozszerzeniem metod wielowymiarowej analizy statystycznej ze względu na sposób reprezentacji danych. Każda komórka w symbolicznej tablicy danych (zmienna symboliczna) może reprezentować dane w postaci liczb, danych jakościowych (tekstowych), przedziałów liczbowych, zbioru wartości, zbioru wartości z wagami. Zmienne mogą ponadto reprezentować strukturę gałęziową oraz być hierarchicznie lub logicznie zależne. Ze względu na sposób reprezentacji symboliczna analiza danych wprowadza nowe metody ich przetwarzania oraz tak implementuje metody tradycyjne, żeby dane symboliczne mogły być ich danymi wejściowymi. W artykule pokazano, jak "klasyczna" analiza Bayesowska może być zaadoptowana dla różnych typów danych symbolicznych za pomocą jądrowego estymatora intensywności dla obiektów symbolicznych. Całość jest zakończona przykładem zastosowania analizy dyskryminacyjnej obiektów symbolicznych do filtrowania przychodzącej poczty elektronicznej. (abstrakt oryginalny)
Twórcy
  • Wrocław University of Economics, Poland
Bibliografia
  • Bock H. H., Did ay E. (2000), Analysis of symbolic data. Explanatory methods for extracting statistical information from complex data, Springer-Verlag, Berlin.
  • Diday E. (2002), An introduction to symbolic data analysis and the SODAS software, J.S.D.A., International E-Journal, http://www.jsda.unina2.it/newjsda/volumes/VOLO/Ed-win.PDF.
  • Dudek A. (2004), Miary podobieństwa obiektów symbolicznych. Odległość Ichino-Yaguchiego, "Prace Naukowe Akademii Ekonomicznej we Wrocławiu", nr 1021, 100-106.
  • Gatnar E. (1998), Symboliczne metody klasyfikacji danych, Wydawnictwo Naukowe PWN, Warszawa.
  • Goldstein M. (1975), Comparison of Some Density Estimate Classification Procedures. "Journal of the American Statistical Association", Part I, 70, Issue 351, 666-669.
  • Hand D. J. (1981), Kernel Discriminant Analysis, Wiley, New York.
  • Holden S. (2004), Porównanie serwerowych filtrów bayesowskich, "Hakin9", 2, 62-71.
  • Malerba D., Espozito F., Giovalle V., Tamma V. (2001), Comparing Dissimilarity Measures for Symbolic Data Analysis, "New Techniques and Technologies for Statistcs" and "Exchange of Technology and Know-how" conference materials (ETK-NTTS'01), 473-481.
  • SODAS. Documentation, SODAS package documentation v.1.20, available at http:// www.ceremade.dauphine.fr/ ~ touati/aidedoc/.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171230721

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.