PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2005 | nr 2 | 34--42
Tytuł artykułu

Budowa pająka internetowego

Autorzy
Warianty tytułu
Języki publikacji
PL
Abstrakty
Wyszukiwarki internetowe są narzędziami, które za pomocą wbudowanych mechanizmów i algorytmów pozwalają na ogarnięcie przez człowieka ogromnego zbioru dokumentów, jakim jest Internet. Wyszukiwarki składają się z trzech elementów: pająka, indeksu oraz interfejsu wyszukującego, zazwyczaj strony WWW. Pająk to robot sieciowy wykorzystywany do zbierania informacji ze stron internetowych i baz danych w sieci. W uproszczony sposób można powiedzieć, że pająk gromadzi informacje znalezione w Internecie zapisując je w indeksie. Dane te wykorzystywane są następnie podczas samego procesu poszukiwania określonych fraz przez użytkownika. Celem niniejszej pracy było stworzenie przykładowego pająka, pobierającego z dokumentów HTML informacje na temat poprawności ich budowy oraz liczebności zawartych w nich elementów. W artykule został przedstawiony projekt oraz implementacja wspomnianego pająka. (abstrakt oryginalny)
Rocznik
Numer
Strony
34--42
Opis fizyczny
Twórcy
autor
  • Wyższa Szkoła Zarządzania i Bankowości w Krakowie
Bibliografia
  • AHistory of Search Engines, http://www.wiley.com/legacy/compbooks/ sonnenreich/history.html
  • Google's index nearly doubles, http://www.google.eom/googleblog/2004/l 1/googles-index-nearly-doubles.html
  • Java 2 Platform, http://java.sun.com
  • JTidy - HTML syntax checker and parser, http://jtidy.sourceforge.net
  • Kłopotek M. A., Inteligentne wyszukiwarki internetowe, Akademicka Oficyna Wydawnicza Exit, 2001
  • Szewczyk Andrzej., Google dla praktyków, Mikom, 2003
  • Trolltech Inc., http://www.trolltech.com/products/qťindex.html
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000167853458

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.