Identyfikacja słów i fraz kluczowych w tekstach polskojęzycznych za pomocą algorytmu RAKE

Lula, Paweł

Artykuł - szczegóły

Czasopismo

Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu. Taksonomia

2014 | 22 | nr 327 Klasyfikacja i analiza danych - teoria i zastosowania | 69--76

Tytuł artykułu

Identyfikacja słów i fraz kluczowych w tekstach polskojęzycznych za pomocą algorytmu RAKE

Autorzy

Paweł Lula

Treść / Zawartość

Pełne teksty:

http://www.dbc.wroc.pl/publication/27744 [zdalny]

Warianty tytułu

Automatic Identification of Keywords and Keyphrases in Documents Written in Polish

Języki publikacji

Abstrakty

Tematyka artykułu związana jest z zagadnieniem automatycznej identyfikacji słów oraz fraz kluczowych w dokumentach tekstowych. Po przedstawieniu podstawowych informacji dotyczących stosowanych metod zaprezentowano algorytm RAKE (Rapid Auto-matic Keyword Extraction), a następnie zaproponowano sposób jego modyfikacji, mający na celu jego lepsze przystosowanie do specyfiki języka polskiego. Przedstawiono również przykładowe zastosowanie algorytmu.(abstrakt oryginalny)

In the paper the problem of automatic identification of keywords and keyphrases in text documents written in Polish is presented. First, the classification of different ap-proaches to the problem of keywords extraction is discussed. Next the RAKE algorithm is shown. The proposition of some modification of the original version of the RAKE method is the main purpose of the article. These changes should improve the quality of results ob-tained for text documents prepared in Polish. Also the exemplary application of the modified version of the algorithm is presented.(original abstract)

Słowa kluczowe

Taksonomia Algorytmy System automatycznej identyfikacji

Taxonomy Algorithms Automatic identification systems (AIS)

Czasopismo

Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu. Taksonomia

Rocznik

2014

Tom

Numer

nr 327 Klasyfikacja i analiza danych - teoria i zastosowania

Strony

69--76

Opis fizyczny

Twórcy

autor

Paweł Lula

Uniwersytet Ekonomiczny w Krakowie

Bibliografia

Gładysz A. (2013), Badanie skuteczności metod identyfikacji słów kluczowych w polskojęzycznych tekstach, rozprawa doktorska, Uniwersytet Ekonomiczny w Krakowie, Kraków.
Konferencja (2013), XXII Konferencja Naukowa Sekcji Klasyfikacji i Analizy Danych PTS oraz XXVII Konferencja Taksonomiczna nt. "Klasyfikacja i analiza danych - teoria i zastosowania", Program i streszczenia, red. M. Walesiak, Uniwersytet Ekonomiczny we Wrocławiu, Wrocław.
Perkins J. (2010), Python Text Processing with NLTK 2.0 Cookbook, Packt Publishing.
Rose S., Engel D., Cramer N., Cowley W. (2010), Automatic Keyword Extraction from Individual Documents, [w:] M.W. Berry, J. Kogan (red.), Text Mining: Theory and Applications, John Wiley & Sons, s. 3-19.
https://github.com/aneesha/RAKE.
http://sujitpal.blogspot.com/2013/03/implementing-rake-algorithm-with-nltk.html.

Typ dokumentu

Bibliografia

Identyfikatory

Identyfikator YADDA

bwmeta1.element.ekon-element-000171281963

Komentarze

Musisz być zalogowany aby pisać komentarze.

Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu. Taksonomia

Identyfikacja słów i fraz kluczowych w tekstach polskojęzycznych za pomocą algorytmu RAKE

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane