Pozyskiwanie wiedzy z relacyjnych baz danych: wielopodmiotowe podsumowania lingwistyczne

Superson, Izabela; Niewiadomski, Adam

Artykuł - szczegóły

Czasopismo

Studia Ekonomiczne / Uniwersytet Ekonomiczny w Katowicach

2014 | nr 199 Technologie wiedzy w zarządzaniu publicznym 2013 | 297--312

Tytuł artykułu

Pozyskiwanie wiedzy z relacyjnych baz danych: wielopodmiotowe podsumowania lingwistyczne

Autorzy

Izabela Superson , Adam Niewiadomski

Treść / Zawartość

Pełne teksty:

http://www.sbc.org.pl/dlibra/docmetadata?id=151213&from=publication [zdalny]

Warianty tytułu

Acquiring Knowledge from Relational Databases: Multi-Subject Linguistic Summaries

Języki publikacji

Abstrakty

Obecnie trudno wyobrazić sobie jakąkolwiek instytucję, przedsiębiorstwo lub placówkę społeczną, która byłaby w stanie sprawnie funkcjonować bez obszernej bazy skomputeryzowanych danych. Niesie to za sobą konieczność analizy oraz przetwarzania dużych zbiorów danych. Ponadto oczekujemy szybkich wyników, przedstawionych w maksymalnie skompresowany, zwięzły sposób, zrozumiały dla szerokiego grona odbiorców. Z pomocą przychodzą podsumowania lingwistyczne relacyjnych baz danych, czyli zdania w języku naturalnym opisujące znaczenie wybranych danych, np. Około połowa [badanych] dzieci to chłopcy. Większość dziewczynek w wieku wczesnoszkolnym, w odniesieniu do chłopców, jest wysokiego wzrostu. Zastosowanie podsumowań lingwistycznych może znacząco usprawnić proces zarządzania wiedzą. Za pomocą odpowiednich algorytmów można pozyskać wiedzę na temat zbioru danych w postaci intuicyjnego komunikatu w języku naturalnym. Dzięki zastosowaniu nieprecyzyjnych wyrażeń liczbowych, takich jak większość, wysoki wzrost, wiek wczesnoszkolny, otrzymuje się komunikat bardziej przyjazny i zrozumiały, bez konieczności posiadania dodatkowej wiedzy na temat analizowanych danych, ponieważ jest wyrażony językiem naturalnym, a nie liczbami, przez co staje się on komunikatywny i czytelny dla statystycznego odbiorcy. Jeżeli w powyższym przykładzie użytoby precyzyjnych liczb, np. 5679 dziewczynek w wieku od 7 do 12 lat, w odniesieniu do chłopców, jest wzrostu od 153 do 165 cm, komunikat mógłby stać się niejasny dla osoby nieposiadającej wiedzy na temat analizowanych danych. Jak łatwo zauważyć, taki komunikat nie daje żadnej praktycznej wiedzy na temat danych użytkownikowi, który nie wie ile jest dziewczynek w analizowanej bazie (nie można określić jaką część zbioru dziewczynek stanowi liczba 5679), jaką część Pozyskiwanie wiedzy z relacyjnych baz danych... 297 stanowią dzieci w wieku od 7 do 12 lat oraz czy przedział 153-165 cm traktować jako średni wzrost, czy może już wysoki. Niewymagane są żadne operacje wstępne, takie jak np. sprawdzenie podstawowej wiedzy na temat danych, a zatem z metody tej mogą korzystać wszyscy użytkownicy, również nieposiadający wiedzy z zakresu informatyki, a jedynie umiejętność obsługi komputera. Zastosowanie tej metody skutkuje wzrostem jakości otrzymywanej wiedzy, ponieważ eliminuje błędy ludzkie oraz wynikające z zastosowania bardzo skomplikowanych i złożonych algorytmów, przy jednoczesnym skróceniu czasu, jaki byłby potrzebny na analizę obszernej bazy danych innymi metodami. Jest to krok w kierunku interfejsów naturalnych, przyjaznych użytkownikowi, gdyż opartych na języku naturalnym. Celem pracy jest przedstawienie możliwości analizy dużych zbiorów danych za pomocą logiki rozmytej oraz zaprezentowanie wyników tej analizy za pomocą języka naturalnego. (fragment tekstu)

The aim of this article is to show how fuzzy logic based algorithms can be applied to analyze large datasets and present its results in a human-friendly form: using natural language. A new concept of linguistic summaries is demonstrated: multi-subject linguistic summaries of relational databases, that extends the classic manner. This paper focuses on new, interesting forms of linguistic summaries, which are represented by equations (4), (11), (15) and (18). This article also contains discussion about calculating degrees of truth of the new forms. From the potential end user point of view simplified form of presenting results using natural language expressions is the most important thing. This paper includes demonstration and description of standalone application that generates analysis of large dataset and presents results using short and intuitive expressions in natural language. Possibilities given by the multi-subject linguistic summaries, e.g. description and comparison of more than one subject in one summarization, makes them great extension and complementation of existing forms of linguistic summaries. (original abstract)

Słowa kluczowe

Systemy informatyczne Programy komputerowe Relacyjne bazy danych

Computer system Computer programs Relation databases

Czasopismo

Studia Ekonomiczne / Uniwersytet Ekonomiczny w Katowicach

Rocznik

2014

Numer

nr 199 Technologie wiedzy w zarządzaniu publicznym 2013

Strony

297--312

Opis fizyczny

Twórcy

autor

Izabela Superson

Politechnika Łódzka

autor

Adam Niewiadomski

Politechnika Łódzka

Bibliografia

Bosc P., Pivert O., Fuzzy Querying in Conventional Databases [w:] Fuzzy Logic for the Management of Uncertainty, eds. L.A. Zadeh, J. Kacprzyk, Wiley, New York 1992.
Flexible Query Answering System, eds. T. Andreasen, H. Christiansen, H.L. Larsen, Kluwer, Boston 1997.
Kacprzyk J., Yager R.R., Linguistic Summaries of Data Using Fuzzy Logic, "International Journal of General Systems" 2001, 30.
Kacprzyk J., Yager R.R., Zadrożny S., A Fuzzy Logic Based Approach to Linguistic Summaries of Databases, "International Journal of Applied Mathematics and Computer science" 2000, 10.
Kacprzyk J., Yager R.R., Zadrożny S., Fuzzy Linguistic Summaries of Databases for an Efficient Business Data Analysis and Decision Support [w:]: Knowledge Discovery for Business Information Systems, eds. W. Abramowicz, J. Zurada, Kluwer Academic Publisher, Boston 2001.
Kacprzyk J., Zadrożny S., Flexible Querying Using Fuzzy Logic: An Implementation for Microsoft Access [w: ] Flexible Query Answering Systems, eds. T. Andreasen, H. Christiansen, H.L. Larsen, Kluwer, Boston 1997.
Niewiadomski A., News Generating via Fuzzy Summarization of Databases, "Lecture Notes in Computer Science" 2006, 3831.
Niewiadomski A., Six New Informativeness Indices of Data Linguistic Summaries [w:] Advances in Intelligent Web Mastering, eds. P.S. Szczepaniak, K. Węgrzyn-Wolska, Springer-Verlag, 2007.
Raschia G., Mouaddib N., SAINTETIQ: A Fuzzy Set-Based Approach to Database Summarization, "Fuzzy Sets and Systems" 2002, 129.
Rasmussen D., Yager R.R., A fuzzy SQL Summary Language for Data Discovery [w:] Fuzzy Information Engineering: A Guided Tour of Application's, eds. D. Dubois, H. Prade, R.R. Yager, Wiley, New York 1997.
Yager R.R., A New Approach to the Summarization of Data, "Information Science" 1982, 28.
Yager R.R., On Ordered Weighted Averaging Operators in Multicriteria Decision Making, " IEEE Transactions on Systems, Man, and Cybernetics" 1988, 18.

Typ dokumentu

Bibliografia

Identyfikatory

Identyfikator YADDA

bwmeta1.element.ekon-element-000171355923

Komentarze

Musisz być zalogowany aby pisać komentarze.

Studia Ekonomiczne / Uniwersytet Ekonomiczny w Katowicach

Pozyskiwanie wiedzy z relacyjnych baz danych: wielopodmiotowe podsumowania lingwistyczne

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane