PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
1993 | nr 660 Informatyka | 105--115
Tytuł artykułu

Kompresja zbiorów baz danych

Warianty tytułu
Compression of Data Base Files
Języki publikacji
PL
Abstrakty
Kompresja ma za zadanie zmniejszenie ilości danych bez utraty zapisanych w nich informacji. Celem niniejszego artykułu jest ukazanie możliwości osiągnięcia, przy niewielkim nakładzie pracy, znacznych korzyści przez zastosowanie kompresji do zbiorów baz danych. W pierwszej części artykułu zanalizowano zbiory baz danych. Zaprezentowano rozkład częstości i zmian częstości występowania symboli oraz liczby wystąpień długich ciągów jednakowych znaków. Analiza ta stanowi uzasadnienie tezy, iż zbiory baz danych są podatne na kompresję. Następnie zostały przedstawione propozycje algorytmów kompresji spełniające warunki narzucane przez specyfikę zbiorów baz danych. Pierwszy - RLE - kodujący długie ciągi jednakowych znaków, drugi - JON - dynamiczna metoda Huffmana i trzeci, stanowiący połączenie dwóch pierwszych. W ostatnim punkcie przeanalizowano skuteczność zaproponowanych algorytmów z użyciem ich do różnych zbiorów baz danych i na podstawie tej analizy oszacowano oszczędności, które można otrzymać. Wyniki świadczą o tym, że warto zastosować algorytmy kompresji w systemach baz danych. (fragment tekstu)
EN
We analyze some characteristics of the data bases' files: symbols' frequencies, changes of symbols' frequencies and number of appearing of long sequences of identical characters. Then we present one of the oldest, simplest and quickest compression method - Run Length Encoding (RLE) and dynamic modification of Huffman's algorithm due to D.W. Jones (JON). We analyze these methods in application to the compression of data bases' files for data processing (transmission, storage) in management information systems used in Poland. Most results given in publications concerned data which are specific "or English language. Our results are obtained for data characteristic for Polish language and associated with Polish management information systems. In conclusions it is possible to obtain significant profits using compression methods in practical data processing: file storage and network transmission. (original abstract)
Rocznik
Strony
105--115
Opis fizyczny
Twórcy
Bibliografia
  • Bell T., Witten I.H., Cleary J.G.: Modelling for Text Compression. ACM Computing Surveys 21, 4 (December 1989), 557-591.
  • Held G.: Data Compression, Techniques and Applications, Hardware and Software Considerations. John Wiley & Sons 1987.
  • Huffman D.A.: A Method for the Construction of Minimum Redundancy Codes. Proc. IRE 40, 9 (September 1952), 1098-1101.
  • Jones D.W.: Application of Splay Trees to Data Compression. Cominun. ACM 31, 8 (August 1988), 996-1007.
  • Maciaszek Ł.; Data Base Design and Implementation, Prentice Hall 1990.
  • Pruchnik R., Kowalska M., Jagiełło J.: Application of Huffman Coding in Management Information System. W: Materiały II Międzynarodowej Konferencji "Information Systems Developers Workbench". Gdansk: UG 1992.
  • Storer J.A., Data Compression: Methods and Theory. Rockville, M.D.: Computer Science Press 1988.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171279813

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.