Warianty tytułu
Evaluation of Dimension Reduction Methods in a Classification of Text Documents Written in Polish Language
Języki publikacji
Abstrakty
W artykule przedstawiono sposób reprezentacji danych w zagadnieniu klasyfikacji dokumentów tekstowych. Omówiono metody redukcji wymiaru macierzy reprezentującej informacje zawarte w dokumentach oraz dokonano oceny wpływu redukcji wymiaru tej macierzy na wyniki klasyfikacji tekstów w języku polskim. (abstrakt oryginalny)
The article submits a method of data representation in an issue concerning text documents classification. The dimension reduction methods for a matrix, which represents information included in documents, have been discussed and an influence of this matrix dimension reduction on results of Polish texts classification has been estimated. (original abstract)
Słowa kluczowe
Rocznik
Numer
Strony
267--276
Opis fizyczny
Twórcy
autor
- Uniwersytet Ekonomiczny w Krakowie, doktorant
Bibliografia
- Aas K., Eikvil L. [1999], Text Categorisation: A Survey, Norwegian Computing Center.
- Berrar D.P., Dubitzky W., Granzow M. [2003], Singular Value Decomposition and Principal Component Analysis in a Practical Approach to Microarray Data Analysis, Kluwer, Norwell.
- Borratyński D. [2005], Klasyfikacja dokumentów tekstowych w języku polskim [w:] Wyzwania gospodarki elektronicznej - stan i perspektywy, Wyższa Szkoła Przedsię-biorczości i Marketingu w Chrzanowie, Chrzanów.
- Deerwester S. i in. [1990], Indexing by Latent Semantic Analysis, "Journal of the American Society for Information Science", 41(6).
- Frakes W.B., Baeza-Yates R. [1992], Information Retrieval: Data Structures and Algorithms, Prentice Hall.
- Gawrysiak P. [1999], Using Data Mining Methodology for Text Retrieval [w:] DIBS'99 Conference Proceedings.
- Hull D.A. [1994], Information Retrieval Using Statistical Classification, Stanford University.
- Kluge B. i in. [2005], Klasteryzacja i klasyfikacja danych spektrometrycznych, Instytut Informatyki Uniwersytetu Warszawskiego, Warszawa.
- Mittal K. [2001], Internet Traffic Growth. Analysis of Trends and Predictions, University of Nebraska.
- Porter M.F. [1980], An Algorithm for Suffix Stripping, "Program: Electronic Library and Information Systems", vol. 14, nr 3.
- Sebastiani F. [1999], A Tutorial on Automated Text Categorisation, Proceedings of ASAI-99, Buenos Aires.
- Sokołowski A. [1992], Empiryczne teksty istotności w taksonomii, Zeszyty Naukowe Akademii Ekonomicznej w Krakowie, nr 108, Kraków.
- Tokarski J. [1993], Schematyczny indeks a tergo polskich form wyrazowych, PWN, Warszawa.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000164863380