PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2012 | nr 30 Internet w społeczeństwie informacyjnym | 59--73
Tytuł artykułu

Ekstrakcja i agregacja zawartości stron internetowych na przykładzie portali pracy

Autorzy
Treść / Zawartość
Warianty tytułu
Extraction and Aggregation of the Job Market Web Sites Content
Języki publikacji
PL
Abstrakty
W artykule przedstawiono możliwości praktycznego wykorzystania narzędzia do ekstrakcji zawartości stron internetowych w celu agregacji danych do dalszych analiz. Wskazano formaty wymiany danych: XML, XLS i CSV, dzięki którym pozyskane dane mogą stać się danymi wejściowymi złożonych systemów analitycznych. Dzięki wykorzystaniu technologii, takich jak eksploracja danych i ETL, systemy te mogą reorganizować dane, przeszukiwać je i w efekcie wyświetlać rezultaty analiz w formie raportów, wykresów i statystyk.(fragment tekstu)
EN
The article presents overview and practical exploration of the data extraction scraping tool for internet web sites content. As the exemplary analytical data source author has chosen job market portals offering the advertisements of new vacancies. Outcome results can be used in further detailed analysis as the input data of the complex analytical systems based on the data exploration, displaying search results according to the chosen criteria. Extraction data tool let the user store output results and exchange the data with other systems through XML, XSL and CSV files. Web scraping mechanism built into the tool offers graphical, action-based, user interactive processes. Data extraction is based on the web macro recordings as well as data and pages patterns generation. (original abstract)
Słowa kluczowe
Twórcy
  • Uniwersytet Szczeciński, doktorant
Bibliografia
  • http://web-harvest.sourceforge.net.
  • http://www.sundewsoft.com.
  • http://www.lixto.com.
  • http://www.newprosoft.com.
  • http://www.pracuj.pl.
  • http://www.eclipse.org.
  • http://www.eclipse.org/PDE.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171353241

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.