PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2014 | nr 199 Technologie wiedzy w zarządzaniu publicznym 2013 | 297--312
Tytuł artykułu

Pozyskiwanie wiedzy z relacyjnych baz danych: wielopodmiotowe podsumowania lingwistyczne

Treść / Zawartość
Warianty tytułu
Acquiring Knowledge from Relational Databases: Multi-Subject Linguistic Summaries
Języki publikacji
PL
Abstrakty
Obecnie trudno wyobrazić sobie jakąkolwiek instytucję, przedsiębiorstwo lub placówkę społeczną, która byłaby w stanie sprawnie funkcjonować bez obszernej bazy skomputeryzowanych danych. Niesie to za sobą konieczność analizy oraz przetwarzania dużych zbiorów danych. Ponadto oczekujemy szybkich wyników, przedstawionych w maksymalnie skompresowany, zwięzły sposób, zrozumiały dla szerokiego grona odbiorców. Z pomocą przychodzą podsumowania lingwistyczne relacyjnych baz danych, czyli zdania w języku naturalnym opisujące znaczenie wybranych danych, np. Około połowa [badanych] dzieci to chłopcy. Większość dziewczynek w wieku wczesnoszkolnym, w odniesieniu do chłopców, jest wysokiego wzrostu. Zastosowanie podsumowań lingwistycznych może znacząco usprawnić proces zarządzania wiedzą. Za pomocą odpowiednich algorytmów można pozyskać wiedzę na temat zbioru danych w postaci intuicyjnego komunikatu w języku naturalnym. Dzięki zastosowaniu nieprecyzyjnych wyrażeń liczbowych, takich jak większość, wysoki wzrost, wiek wczesnoszkolny, otrzymuje się komunikat bardziej przyjazny i zrozumiały, bez konieczności posiadania dodatkowej wiedzy na temat analizowanych danych, ponieważ jest wyrażony językiem naturalnym, a nie liczbami, przez co staje się on komunikatywny i czytelny dla statystycznego odbiorcy. Jeżeli w powyższym przykładzie użytoby precyzyjnych liczb, np. 5679 dziewczynek w wieku od 7 do 12 lat, w odniesieniu do chłopców, jest wzrostu od 153 do 165 cm, komunikat mógłby stać się niejasny dla osoby nieposiadającej wiedzy na temat analizowanych danych. Jak łatwo zauważyć, taki komunikat nie daje żadnej praktycznej wiedzy na temat danych użytkownikowi, który nie wie ile jest dziewczynek w analizowanej bazie (nie można określić jaką część zbioru dziewczynek stanowi liczba 5679), jaką część Pozyskiwanie wiedzy z relacyjnych baz danych... 297 stanowią dzieci w wieku od 7 do 12 lat oraz czy przedział 153-165 cm traktować jako średni wzrost, czy może już wysoki. Niewymagane są żadne operacje wstępne, takie jak np. sprawdzenie podstawowej wiedzy na temat danych, a zatem z metody tej mogą korzystać wszyscy użytkownicy, również nieposiadający wiedzy z zakresu informatyki, a jedynie umiejętność obsługi komputera. Zastosowanie tej metody skutkuje wzrostem jakości otrzymywanej wiedzy, ponieważ eliminuje błędy ludzkie oraz wynikające z zastosowania bardzo skomplikowanych i złożonych algorytmów, przy jednoczesnym skróceniu czasu, jaki byłby potrzebny na analizę obszernej bazy danych innymi metodami. Jest to krok w kierunku interfejsów naturalnych, przyjaznych użytkownikowi, gdyż opartych na języku naturalnym. Celem pracy jest przedstawienie możliwości analizy dużych zbiorów danych za pomocą logiki rozmytej oraz zaprezentowanie wyników tej analizy za pomocą języka naturalnego. (fragment tekstu)
EN
The aim of this article is to show how fuzzy logic based algorithms can be applied to analyze large datasets and present its results in a human-friendly form: using natural language. A new concept of linguistic summaries is demonstrated: multi-subject linguistic summaries of relational databases, that extends the classic manner. This paper focuses on new, interesting forms of linguistic summaries, which are represented by equations (4), (11), (15) and (18). This article also contains discussion about calculating degrees of truth of the new forms. From the potential end user point of view simplified form of presenting results using natural language expressions is the most important thing. This paper includes demonstration and description of standalone application that generates analysis of large dataset and presents results using short and intuitive expressions in natural language. Possibilities given by the multi-subject linguistic summaries, e.g. description and comparison of more than one subject in one summarization, makes them great extension and complementation of existing forms of linguistic summaries. (original abstract)
Twórcy
  • Politechnika Łódzka
  • Politechnika Łódzka
Bibliografia
  • Bosc P., Pivert O., Fuzzy Querying in Conventional Databases [w:] Fuzzy Logic for the Management of Uncertainty, eds. L.A. Zadeh, J. Kacprzyk, Wiley, New York 1992.
  • Flexible Query Answering System, eds. T. Andreasen, H. Christiansen, H.L. Larsen, Kluwer, Boston 1997.
  • Kacprzyk J., Yager R.R., Linguistic Summaries of Data Using Fuzzy Logic, "International Journal of General Systems" 2001, 30.
  • Kacprzyk J., Yager R.R., Zadrożny S., A Fuzzy Logic Based Approach to Linguistic Summaries of Databases, "International Journal of Applied Mathematics and Computer science" 2000, 10.
  • Kacprzyk J., Yager R.R., Zadrożny S., Fuzzy Linguistic Summaries of Databases for an Efficient Business Data Analysis and Decision Support [w:]: Knowledge Discovery for Business Information Systems, eds. W. Abramowicz, J. Zurada, Kluwer Academic Publisher, Boston 2001.
  • Kacprzyk J., Zadrożny S., Flexible Querying Using Fuzzy Logic: An Implementation for Microsoft Access [w: ] Flexible Query Answering Systems, eds. T. Andreasen, H. Christiansen, H.L. Larsen, Kluwer, Boston 1997.
  • Niewiadomski A., News Generating via Fuzzy Summarization of Databases, "Lecture Notes in Computer Science" 2006, 3831.
  • Niewiadomski A., Six New Informativeness Indices of Data Linguistic Summaries [w:] Advances in Intelligent Web Mastering, eds. P.S. Szczepaniak, K. Węgrzyn-Wolska, Springer-Verlag, 2007.
  • Raschia G., Mouaddib N., SAINTETIQ: A Fuzzy Set-Based Approach to Database Summarization, "Fuzzy Sets and Systems" 2002, 129.
  • Rasmussen D., Yager R.R., A fuzzy SQL Summary Language for Data Discovery [w:] Fuzzy Information Engineering: A Guided Tour of Application's, eds. D. Dubois, H. Prade, R.R. Yager, Wiley, New York 1997.
  • Yager R.R., A New Approach to the Summarization of Data, "Information Science" 1982, 28.
  • Yager R.R., On Ordered Weighted Averaging Operators in Multicriteria Decision Making, " IEEE Transactions on Systems, Man, and Cybernetics" 1988, 18.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171355923

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.