PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2014 | 22 | nr 327 Klasyfikacja i analiza danych - teoria i zastosowania | 69--76
Tytuł artykułu

Identyfikacja słów i fraz kluczowych w tekstach polskojęzycznych za pomocą algorytmu RAKE

Autorzy
Treść / Zawartość
Warianty tytułu
Automatic Identification of Keywords and Keyphrases in Documents Written in Polish
Języki publikacji
PL
Abstrakty
Tematyka artykułu związana jest z zagadnieniem automatycznej identyfikacji słów oraz fraz kluczowych w dokumentach tekstowych. Po przedstawieniu podstawowych informacji dotyczących stosowanych metod zaprezentowano algorytm RAKE (Rapid Auto-matic Keyword Extraction), a następnie zaproponowano sposób jego modyfikacji, mający na celu jego lepsze przystosowanie do specyfiki języka polskiego. Przedstawiono również przykładowe zastosowanie algorytmu.(abstrakt oryginalny)
EN
In the paper the problem of automatic identification of keywords and keyphrases in text documents written in Polish is presented. First, the classification of different ap-proaches to the problem of keywords extraction is discussed. Next the RAKE algorithm is shown. The proposition of some modification of the original version of the RAKE method is the main purpose of the article. These changes should improve the quality of results ob-tained for text documents prepared in Polish. Also the exemplary application of the modified version of the algorithm is presented.(original abstract)
Twórcy
autor
  • Uniwersytet Ekonomiczny w Krakowie
Bibliografia
  • Gładysz A. (2013), Badanie skuteczności metod identyfikacji słów kluczowych w polskojęzycznych tekstach, rozprawa doktorska, Uniwersytet Ekonomiczny w Krakowie, Kraków.
  • Konferencja (2013), XXII Konferencja Naukowa Sekcji Klasyfikacji i Analizy Danych PTS oraz XXVII Konferencja Taksonomiczna nt. "Klasyfikacja i analiza danych - teoria i zastosowania", Program i streszczenia, red. M. Walesiak, Uniwersytet Ekonomiczny we Wrocławiu, Wrocław.
  • Perkins J. (2010), Python Text Processing with NLTK 2.0 Cookbook, Packt Publishing.
  • Rose S., Engel D., Cramer N., Cowley W. (2010), Automatic Keyword Extraction from Individual Documents, [w:] M.W. Berry, J. Kogan (red.), Text Mining: Theory and Applications, John Wiley & Sons, s. 3-19.
  • https://github.com/aneesha/RAKE.
  • http://sujitpal.blogspot.com/2013/03/implementing-rake-algorithm-with-nltk.html.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171281963

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.