PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2010 | nr 814 | 65--76
Tytuł artykułu

Systemy ekstrakcji informacji

Warianty tytułu
Information Extraction Systems
Języki publikacji
PL
Abstrakty
Duża liczba informacji w formie tekstu oraz brak narzędzi pozwalających na skuteczną analizę danych w takiej postaci stanowią inspirację dla naukowców z wielu ośrodków badawczych do poszukiwania nowych rozwiązań w dziedzinie text mining. Jedną z intensywnie rozwijających się metod eksploracji tekstu jest ekstrakcja informacji pozwalająca na uzyskanie danych o określonej strukturze z treści zapisanej w języku naturalnym. W artykule zarysowano historię rozwoju tej dyscypliny oraz wskazano podstawowe różnice między koncepcjami wykorzystanymi w ekstrakcji informacji i w innych metodach eksploracji tekstu. Celem tej pracy jest przedstawienie najważniejszych etapów procesu ekstrakcji informacji. Przebieg procesu ilustrowany jest przykładem, który ułatwia poznanie idei kolejnych operacji. Systemy ekstrakcji informacji mają różną skuteczność. W pracy przedstawiono najbardziej popularne charakterystyki efektywności systemów. Wskazano też możliwości wykorzystania metody ekstrakcji informacji w praktyce gospodarczej oraz dalsze kierunki rozwoju tej dyscypliny. (abstrakt oryginalny)
EN
A great deal of textual information and lack of tools allowing effective analysis of such data inspire numerous researchers to searching for new solutions in the field of text mining. One of text exploration methods, being intensively developed, is the information extraction, which allows obtaining data having a determined structure and taken out from a content written in the natural language. The article outlines a historical development of this discipline and indicates basic differences between ideas exploited in the information extraction and in other text exploration methods. The goal of the paper is to address most important stages of the information extraction process. The whole process is illustrated by a simple example that facilitates acquainting with subsequent operations. Information extraction systems have different efficiencies. The study presents most popular characteristics of system effectiveness. Possibilities of information extraction methods utilisation in business practice and further development directions in this area have also been indicated. (original abstract)
Rocznik
Numer
Strony
65--76
Opis fizyczny
Twórcy
  • Uniwersytet Ekonomiczny w Krakowie, doktorant
Bibliografia
  • Chinchor N.A. [2001], Overview of MUC-7/MET-2, Science Applications International Corporation, Proceedings of the 7th Message Understanding Conference (MUC-7), Fairfax, USA.
  • De Sitter A. [2004], A Formal Framework for Evaluation of Information Extraction, University of Antwerp, Antwerp.
  • Grishman R. [1997], Information Extraction: Techniques and Challenges, New York University.
  • Grishman R., Sundheim B. [1996], Message Understanding Conference - 6: A Brief History, 16th International Conference on Computational Linguistics, Copenhagen.
  • Hobbs T.L., Karmarkar U., Hobbs J.R. [1998|, Open-domain Information Extraction from Business News, SRI International, Menlo Park.
  • Ignat C. i in. [20031, Extending an Information Extraction Tool Set to Central and Eastern European Languages, European Commission - Joint Research Centre, Proceedings of the International Workshop Information Extraction for Slavonic and Other Central and Eastern European Languages, Borovets, Bulgaria.
  • Jurafsky D., Martin J.H. [2009], Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistic, and Speech Recognition, Prentice Hall, Upper Saddle River.
  • Maynard D., Peters W., Li Y. [2006], Metrics for Evaluation of Ontology-based Information Extraction, University of Sheffield, Sheffield.
  • Text Mining Summit Conference Brochure [2005], http://www.textminingnews.com/.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000169374647

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.