Czasopismo
Tytuł artykułu
Autorzy
Warianty tytułu
Automatic Identification of Keywords and Keyphrases in Documents Written in Polish
Języki publikacji
Abstrakty
Tematyka artykułu związana jest z zagadnieniem automatycznej identyfikacji słów oraz fraz kluczowych w dokumentach tekstowych. Po przedstawieniu podstawowych informacji dotyczących stosowanych metod zaprezentowano algorytm RAKE (Rapid Auto-matic Keyword Extraction), a następnie zaproponowano sposób jego modyfikacji, mający na celu jego lepsze przystosowanie do specyfiki języka polskiego. Przedstawiono również przykładowe zastosowanie algorytmu.(abstrakt oryginalny)
In the paper the problem of automatic identification of keywords and keyphrases in text documents written in Polish is presented. First, the classification of different ap-proaches to the problem of keywords extraction is discussed. Next the RAKE algorithm is shown. The proposition of some modification of the original version of the RAKE method is the main purpose of the article. These changes should improve the quality of results ob-tained for text documents prepared in Polish. Also the exemplary application of the modified version of the algorithm is presented.(original abstract)
Rocznik
Tom
Strony
69--76
Opis fizyczny
Twórcy
autor
- Uniwersytet Ekonomiczny w Krakowie
Bibliografia
- Gładysz A. (2013), Badanie skuteczności metod identyfikacji słów kluczowych w polskojęzycznych tekstach, rozprawa doktorska, Uniwersytet Ekonomiczny w Krakowie, Kraków.
- Konferencja (2013), XXII Konferencja Naukowa Sekcji Klasyfikacji i Analizy Danych PTS oraz XXVII Konferencja Taksonomiczna nt. "Klasyfikacja i analiza danych - teoria i zastosowania", Program i streszczenia, red. M. Walesiak, Uniwersytet Ekonomiczny we Wrocławiu, Wrocław.
- Perkins J. (2010), Python Text Processing with NLTK 2.0 Cookbook, Packt Publishing.
- Rose S., Engel D., Cramer N., Cowley W. (2010), Automatic Keyword Extraction from Individual Documents, [w:] M.W. Berry, J. Kogan (red.), Text Mining: Theory and Applications, John Wiley & Sons, s. 3-19.
- https://github.com/aneesha/RAKE.
- http://sujitpal.blogspot.com/2013/03/implementing-rake-algorithm-with-nltk.html.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171281963