Wyniki wyszukiwania - BazEkon

1

Wykorzystanie informacji pochodzących z dokumentów tekstowych w problemach modelowania i klasyfikacji

100%

Lula P.

Prace Naukowe Akademii Ekonomicznej we Wrocławiu. Taksonomia

|

2006

|

13

|

nr 1126 Klasyfikacja i analiza danych - teoria i zastosowania

130-136

Niniejszą pracę rozpoczyna prezentacja podstawowych zagadnień związanych z text miningiem. Przedstawiona zostanie jego definicja, związki z innymi metodami badań oraz krótki przegląd problemów badawczych rozpatrywanych na jego gruncie. Kolejny punkt pracy dotyczy metod pozyskiwania informacji z dokumentów tekstowych i sposobów jej reprezentacji. Kontynuacją tego zagadnienia są rozważania zawarte w następnej części pracy, które dotyczą sposobów wykorzystania pozyskanych informacji w procesie analizy. Poruszone w artykule problemy zilustrowane zostaną przykładem wykorzystującym rzeczywiste dane tekstowe. Końcowa część pracy zawiera wnioski i spis wykorzystanej literatury. (fragment tekstu)

2

Cluster Analysis of Medical Text Documents by Using Semi-Clustering Approach Based on GRAPH Representation

100%

Woźniak R., Ożdżyński P., Zakrzewska D.

Information Systems in Management

|

2018

|

7

|

nr 3

213-224

The development of Internet resulted in an increasing number of online text repositories. In many cases, documents are assigned to more than one class and automatic multi-label classification needs to be used. When the number of labels exceeds the number of the documents, effective label space dimension reduction may significantly improve classification accuracy, what is a major priority in the medical field. In the paper, we propose document clustering for label selection. We use semi-clustering method, by considering graph representation, where documents are represented by vertices and edge weights are calculated according to their mutual similarity. Assigning documents to semi-clusters helps in reducing number of labels, further used in multi-label classification process. The performance of the method is examined by experiments conducted on real medical datasets. (original abstract)

3

Hermeneutyka jako sztuka interpretacji tekstu

100%

Leszczyński A. C.

Przestrzeń, Ekonomia, Społeczeństwo

|

2012

|

nr 1/1

9-25

Hermeneutyka jest sztuką, umiejętnością opartą na regułach. Umiejętność ta dotyczy interpretacji, czyli rozumienia w szczególny - własny - sposób tekstu: wszelkiej całości semantycznej. Reguły sztuki interpretacji, to tekstocentryczność - pomijanie osoby autora; oraz pretekstualność - uznanie tekstu za możliwość urzeczywistnianą w świadomości odbiorczej. (abstrakt oryginalny)

4

Identifing the Destination Image and its Attributes: The Case of Central and Eastern European Cities

100%

Nowacki M., Niezgoda A.

Prace Naukowe Uniwersytetu Ekonomicznego we Wrocławiu

|

2019

|

nr 8 (63)

118-127

Celem pracy jest zidentyfikowanie unikatowych atrybutów wybranych miast Europy Środkowo-Wschodniej obecnych w opiniach zamieszczonych na portalu TripAdvisor [https://www.tripadvisor.co.uk]. Pobrano opinie dotyczące centrów turystycznych wybranych miast (kategoria Things to do...) - obszarów, w których koncentruje się ruch turystyczny w miastach: w zabytkowym centrum, na starym mieście, na starym rynku. Do badań wybrano najpopularniejsze pod względem turystycznym miasta Europy Środkowo-Wschodniej: Poznań, Wrocław, Kraków, Warszawę oraz Pragę, Bratysławę i Wiedeń. Łącznie pobrano 28 794 opinie. Procedurą Text Mining zliczono najczęstsze wyrazy pojawiające się w opiniach. Analiza wariancji ujawniła 76 unikatowych słów, które poddano analizie korespondencji. Wśród badanych miast najwięcej unikatowych słów-atrybutów ma Bratysława, najmniej zaś Praga. Zbliżone do siebie pod względem atrybutów wizerunku są: Poznań, Wrocław i Praga, a w drugiej grupie - Warszawa i Bratysława. Wiedeń i Kraków nie wykazują podobieństwa z pozostałymi miastami.(abstrakt oryginalny)

5

A Modification of the Leacock-Chodorow Measure of the Semantic Relatedness of Concepts

100%

Korzeniewski J.

Acta Universitatis Lodziensis. Folia Oeconomica

|

2020

|

vol. 6, t. 351

97-106

Miary semantycznego podobieństwa pojęć można podzielić na dwa rodzaje: metody oparte na wiedzy i metody oparte na bazie tekstów. Techniki oparte na wiedzy stosują stworzone przez człowieka słowniki oraz inne opracowania. Techniki oparte na bazie tekstów oceniają podobieństwo semantyczne dwóch pojęć, odwołując się do obszernych baz dokumentów tekstowych. Niektórzy badacze twierdzą, że miary oparte na wiedzy są lepsze jakościowo od tych opartych na bazie tekstów, ale o wiele istotniejsze jest to, że te drugie zależą bardzo mocno od użytej bazy tekstów. W niniejszym artykule przedstawiono propozycję modyfikacji najlepszej metody pomiaru semantycznego podobieństwa pojęć, opartej na sieci WordNet, a mianowicie miary Leacock-Chodorowa. Ta miara była najlepsza w kilku eksperymentach badawczych oraz można zapisać ją za pomocą prostej formuły. Nową propozycję oceniono na podstawie dwóch popularnych benchmarkowych zbiorów par pojęć, tj. zbioru 65 par pojęć Rubensteina-Goodenougha oraz zbioru 353 par pojęć Fickelsteina. Wyniki pokazują, że przedstawiona propozycja spisała się lepiej od tradycyjnej miary Leacock-Chodorowa. (abstrakt oryginalny)

6

The Serialization of Heterogeneous Documents

100%

Hampton P. J., Blackburn W., Wang H.

Annals of Computer Science and Information Systems

|

2015

|

6

25-30

Tasks involving the analysis of natural language are typically conducted on a corpus or corpora of plain text. However, it is rare that a document is unstructured and freeform in its entirety. Documents such as corporate disclosures, medical journals and other knowledge rich archive contain structured and loosely-structured information that can be used in a variety of important text mining tasks. In this paper we propose a syntactical preprocessing architecture to serialize presentationoriented documents to a machine readable format that aspires to preserve the document structure, contents and metadata. We introduce a hybrid pipeline architecture, discussing the various processes and the future research direction that could potentially lead to a holistic representation of heterogeneous documents. (original abstract)

7

An Attempt to Determine the Scope of Duties of the Business Analyst - Application of Text Mining Analysis

100%

Wyskwarski M.

Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska

|

2020

|

z. 148 Contemporary management

795-810

Purpose: An attempt to identify the scope of duties of the business analyst by analyzing job offers from websites. Design/methodology/approach: Job offers were automatically downloaded from five websites. An analysis of text mining of fragments of offers describing the scope of duties was carried out. The analysis of text mining included initial text processing, creation of corpora of analyzed documents, creation of a document-term matrix and the use of classic methods derived from data mining. Findings: The most frequently used words/n-grams and the correlation of selected words/ n-grams with other words/n-grams were presented in the form of drawings. Based on the frequency of words/n-grams and the correlation value, efforts were made to identify the responsibilities of the business analyst. Research limitations/implications: Only offers written in Polish, downloaded from five websites with job offers, which had the phrase "business analyst" in their job title, were analyzed. The data was collected between 13 and 15 April 2020. Practical implications: The method applied can be used by organizations preparing for the profession of a business analyst, to modify and better adapt curricula to the needs of the labor market. Originality/value: Studies have shown that text mining of job offers can, to some extent, help determine the responsibilities of a business analyst. (original abstract)

8

The Usage of Colours as a Text Highlighting Technique

75%

Krzos P.

Zeszyty Naukowe Małopolskiej Wyższej Szkoły Ekonomicznej w Tarnowie

|

2017

|

36

|

nr 4

101-110

W różnych sytuacjach występuje potrzeba wyróżnienia fragmentu tekstu. W tym celu dostępnych jest wiele różnych technik, między innymi: kolor czcionki, kolor tła, podkreślenie, wielkość i styl czcionki, kapitalizacja. Wytyczne opisujące użycie kolorów w różnych kontekstach można odnaleźć w wielu źródłach. W ciągu ubiegłego stulecia przeprowadzono liczne badania w tej dziedzinie, jednak jak dotąd nie badano wpływu kolorów na intensywność efektu wyróżniania (ang. pop-out effect). Na podstawie przeprowadzonej ankiety i analizy tego zjawiska określony został ranking najlepszych kolorów używanych do wyróżniania tekstu. Zweryfikowane zostały dwie metody (kolor czcionki i kolor tła) dla sześciu podstawowych kolorów. Badanie zostało przeprowadzone dwukrotnie na tej samej grupie respondentów, aby sprawdzić stabilność odpowiedzi. Spójność opinii została zbadana przy użyciu metody AHP. Wyniki wskazują, że istnieją znaczne różnice między kolorami. Preferencje zostały pogrupowane w klasy. Stabilność odpowiedzi została potwierdzona, jednak niektóre wyrażane poglądy nie są spójne. Przeprowadzone badanie stanowi wstęp do omawianego tematu. Wiele czynników pozostaje poza zakresem niniejszego artykułu i stanowi potencjał do dalszych eksperymentów (m.in. specyfika kulturowa, odcienie kolorów, kontekst prezentacji). (abstrakt oryginalny)

9

Exploring the Relationship between Viewer Experience and Movie Genre - a Study Based on Text Mining of Online Movie Reviews

75%

Świerczyńska-Kaczor U.

Problemy Zarządzania

|

2019

|

17

|

nr 5 (85) Big Data Phenomenon in the Economic and Social Spheres

154-175

Niniejsza publikacja oferuje wgląd w doświadczenia widzów związane z konsumpcją filmów należących do różnych gatunków, takich jak suspens, western oraz komedia. Badanie zostało przeprowadzone z wykorzystaniem jakościowej i ilościowej analizy text mining recenzji trzech wybranych tytułów filmowych. Wyniki analizy opartej na text mining uzupełnia badanie jakościowe recenzji filmowych. Wyniki badania pozwoliły na uchwycenie spektrum czynników oddziałujących na doświadczenia widzów na różnych etapach konsumpcji produktu, jakim jest film - podróży zakupowej konsumenta. Czynniki te związane są m.in. z cechami produktu (np. marka reżysera, gwiazdorska obsada, ścieżka dźwiękowa, historyczny kontekst fabuły filmu) oraz różnymi punktami "kontaktu" kreującymi doświadczenia widza (np. kanał dystrybucji filmu). Wyodrębnione kategorie doświadczeń widza odpowiadają analizowanym gatunkom filmowym. Prezentowane w niniejszej publikacji badanie ma charakter badań wstępnych, eksploracyjnych. (abstrakt oryginalny)

10

The Text Mining of Public Policy Documents in Response to COVID-19: A Comparison of the United Arab Emirates and the Kingdom of Saudi Arabia

75%

Dwivedi D. N., Anand A.

Zarządzanie Publiczne / Uniwersytet Ekonomiczny w Krakowie

|

2021

|

nr 1 (55)

8-22

Objective: The objective of the paper is to analyse publicly available government policy documents of the United Arab Emirates (UAE) and the Kingdom of Saudi Arabia (KSA) in order to identify key topics and themes for these two countries in relation to the COVID-19 response. Research Design & Methods: In view of the availability of large volumes of documents as well as advancement in computing system, text mining has emerged as a significant tool to analyse large volumes of unstructured data. For this paper, we have applied latent semantic analysis and Singular Value Decomposition (SVD) for text clustering. Findings: The results of the analysis of terms indicate similarities of key themes around health and pandemic for the UAE and the KSA. However, the results of text clustering indicate that focus of the UAE' documents in on 'Digital'-related terms, whereas for the KSA, it is around 'International Travel'-related terms. Further analysis of topic modelling demonstrates that topics such as 'Vaccine Trial', 'Economic Recovery', 'Health Ministry', and 'Digital Platforms' are common across both the UAE and the KSA. Contribution / Value Added: The study contributes to text-mining literature by providing a framework for analyzing public policy documents at the country level. This can help to understand the key themes in policies of the governments and can potentially aid the identification of the success and failure of various policy measures in certain cases by means of comparing the outcomes. Implications / Recommendations: The results of this study clearly showed that text clustering of unstructured data such as policy documents could be very useful for understanding the themes and orientation topics of the policies. (original abstract)

11

Identification of Technologies in Industry 4.0 With the Use of Text Mining

75%

Zdonek D.

Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska

|

2020

|

z. 142 Quantitative Methods in Economics, Finance, Management and Quality Sciences

45-57

Purpose: The objective of this paper is to identify leading technologies in Industry 4.0. Design/methodology/approach: The identification was made with the use of text mining to explore the scientific texts in this field. Assumptions of own iterative method for analyzing scientific texts were proposed, with the use of R language, tokenization, lemmatization, n-grams and correspondence analysis. The assumptions of the proposed method were used to analyze the 40 most often quoted articles indexed in the Web of Science. Findings: On the basis of the obtained results, 4 leading technologies were identified. These are Cloud Computing, Internet of Things, Cyber-physical System and Big Data. Originality/value: The article proposes an original method of identifying the leading technologies used in Industry 4.0. The proposed method is based on text mining and correspondence analysis. (original abstract)

12

Application of Text-Mining for Analysis and Knowledge Clustering Published in Scientific Journal Studies and Proceedings of the Polish Association for Knowledge Management

75%

Drelichowski L., Siwiec J.

Studia i Materiały Polskiego Stowarzyszenia Zarządzania Wiedzą

|

2012

|

58

47-62

Artykuł zawiera przykład zastosowania metod klasteringu i analizy text-miningu artykułów opublikowanych w języku angielskim w wydawnictwie Studia i Materiały Polskiego Stowarzyszenia Zarządzania Wiedzą. Text-mining stanowi metodę pozyskiwania wiedzy z danych tekstowych. W ramach tego procesu osiągamy efekt kreowania nowej wiedzy z tekstu. W pracy zamieszczono interpretację zastosowania metody klasteringu w procesie ekstrakcji wiedzy poprzez analizę podobieństwa treści ekstraktu tekstu oraz struktury badanych artykułów. Poprzez analizę stworzono możliwość wykonania serii symulacji pozwalających dokonać oceny wpływu zmian liczby klastrów na powstawanie i liczebność grup homogenicznych. (abstrakt oryginalny)

13

Comparative Research of Central and Eastern European Startup Researches Based on Artificial Intelligence-Based Natural Language Processing

75%

Gosztonyi M.

Journal of Intercultural Management

|

2021

|

13

|

nr 4

4-33

Objective: In our study, we analyze Central and Eastern European (CEE) scientific papers published in peer-reviewed scientific journals between 2015 and 2021. We examine what category systems and methods are used in Central and Eastern European start-up researches in the recent years.Methodology: Our used methodology was structured literature review analysis and artificial intelligence-based natural language processing which is one of the most evolving methodological directions in economics and social sciences at present but it is very rarely used in review analysis of startup research.Value Added: The NLP method has not been widely used for the analysis of the startup literature. Furthermore, our study is the first which analyzes CEE startups research with NLP technique.Findings: Based on our results, it can be stated that CEE startup researches follow the big global startup research narratives. However, a specific conceptual network is also emerging which contains several shifts of emphasis compared to the directions of global research. (original abstract)

14

The Role of Word and N-gram Frequency Analysis in Inference of the Content of Scientific Publication

75%

Zdonek I.

Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska

|

2020

|

z. 142 Quantitative Methods in Economics, Finance, Management and Quality Sciences

21-31

Purpose: The paper presents an analysis of a scientific publication with regard to the frequency of words and n-grams. The research problem addressed was the question to what extent the text mining analysis of a scientific publication will allow to infer its content. Design/methodology/approach: The main research method is the analysis of tokenized text using word count functions, bigrams, and trigrams in selected sections of a scientific publication. The results of text mining analysis were compared with the classic, non-automated text analysis of the publication. The presented study is a pilot project in the form of a case study. Findings: The proposed method of analyzing a scientific text using an analysis of the frequency of words and n-grams enables inference of the content of the paper with regard to the names of variables involved in the study, the statistical apparatus used and the key literature cited. It should be observed, however, that the discussed method does not make it possible to establish which variables are moderators and which are mediators. Originality/value: In this paper, the text mining technique was used differently in the discussed study than in previous works. The publication was not examined in its entirety, as previous researchers did, but text mining analysis was applied to individual parts of the paper, i.e. the part discussing theoretical foundations of the research and the part presenting the research method, research results, and their discussion. This allowed for obtaining more precise results regarding the content of the publication. (original abstract)

15

Kierunki rozwoju badań zarządzania jakością

75%

Wawak S.

Management and Quality

|

2022

|

4

|

nr 2

371-385

Artykuł przedstawia analizę zmian w zainteresowaniach badawczych w obszarze zarządzania jakością. Celem artykułu jest odkrycie nowych lub zmodyfikowanych kierunków badań, które pojawiły się w latach 2020-21. Jest on rozwinięciem wcześniejszych badań nad trendami w zarządzaniu jakością. Wykorzystano narzędzia eksploracji tekstu. Wybrano 2399 artykułów naukowych z 13 wiodących czasopism poświęconych tematyce jakości notowanych w Scopus. Wskazano 6 nowych lub zmodyfikowanych kierunków badań. Ponadto wskazano na rosnące zainteresowanie tematyką przemysłu 4.0 i jakości 4.0. (abstrakt oryginalny)

16

The Curriculum Content Analysis for the Construction of the Teaching Process

75%

Kempa A., Zacny B.

Studia i Materiały Polskiego Stowarzyszenia Zarządzania Wiedzą

|

2012

|

60

96-107

Zwiększanie stopnia swobody w kształtowaniu procesu dydaktycznego na uczelniach wyższych wymaga coraz więcej sprawności w zarządzaniu wiedzą o procesie dydaktycznym. Głównym motywem prac autorek nad analizą treści programowych było wykrywanie nadmiernego powtarzania treści programowych na danej ścieżce kształcenia. Podczas tych prac autorki posiłkowały się metodami statystycznymi. Otrzymane wyniki pozwoliły na zweryfikowanie treści programowych przedmiotów zawartych w sylabusach oraz wstępne rozpoznanie zadania automatyzacji analizy zawartości sylabusów z użyciem metod text mining. Rozważania dotyczące rozszerzenia istniejącego systemu wspomagającego tworzenie sylabusów o metody weryfikacji ich treści oraz wstępna koncepcja takiego systemu zawarta została w końcowej części niniejszego artykułu. (abstrakt oryginalny)

17

Analiza wpisów na portalu Twitter z wykorzystaniem narzędzi big data zawartych w pakiecie R

75%

Kisiołek A.

Studia Ekonomiczne / Uniwersytet Ekonomiczny w Katowicach

|

2018

|

nr 362

306-317

Wraz z rozwojem internetu, mediów społecznościowych oraz technologii mobilnych znacznie wzrosła ilość generowanych danych. Dane te, zarówno w formie ustrukturalizowanej, jak i nieustrukturalizowanej, mogą nieść wartość biznesową dla przedsiębiorców. W danych big data można znaleźć m.in. informacje na temat klientów, konkurencji, rynku pracy, opinii na temat produktów danej firmy, czy aktualnych trendów. Dzięki dokładnej analizie internetu i mediów społecznościowych, interesariusze mogą pozyskać nową wartość, jaką są informacje na temat nastawienia i opinii konsumentów. Celem artykułu jest przedstawienie narzędzi big data jako jednego ze sposobów analizy mediów społecznościowych i wyciągania w ten sposób wartościowych informacji. Przedmiotem przeprowadzonej analizy były tysiące tweetów użytkowników portalu Twitter. Analiza została przeprowadzona przy wykorzystaniu technik text mining oraz sentyment analysis.(abstrakt oryginalny)

18

Text Mining in the Identification of Duties and Responsibilities of the Project Manager

75%

Wyskwarski M.

Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Śląska

|

2020

|

z. 144

649-660

Purpose: An attempt to identify the duties and responsibilities of the project manager by analysing job offers from a job website. An attempt to determine whether there were any changes between 2018 and 2019. Design/methodology/approach: Text mining was performed for fragments of job offers, describing the duties and responsibilities. The text mining analysis consisted of initial processing of the text, creation of a corpus of analysed documents, construction of a word frequency matrix and use of classical methods from the data mining are. Findings: The most common words in job offers are presented, as well as their correlation with other words. With the use of the Topic modeling algorithm, hidden topics describing the analysed job offers have been generated. These topics can also be used to identify the duties and responsibilities of a project manager. Research limitations/implications: Only the job offers meeting the following conditions were analysed: (1) they concerned the job of "project manager"; (2) the content was in Polish; (3) they were provided by www.pracuj.pl website; (4) they were collected from 09 to 11 April in 2018 and 2019. Practical implications: This method can be used by organizations training project managers, in order to modify and better adjust the curriculum to the needs of the labour market. Originality/value: Research has shown that text mining can be used to determine the responsibilities of a project manager by analysing job offers. (original abstract)

19

Defining Innovation with Text-Mining

75%

Józwiak P.

Zeszyty Naukowe. Organizacja i Zarządzanie / Politechnika Łódzka

|

2016

|

z. 64, nr 1208

13-19

W artykule zostały wykorzystane metody analizy danych tekstowych do przedstawienia sposobu postrzegania podejścia do innowacji w wiadomościach pochodzących z Polski, Stanów Zjednoczonych i Chin. Przedstawiono proces analizy składający się pozyskiwania danych, czyszczenia oraz analiz w aplikacji Rapidminer. Wyniki zostały przedstawione za pomocą grafów ISOM przedstawiających podejście do innowacji w wymienionych wcześniej krajach.(abstrakt oryginalny)

20

Ramy interpretacyjne jako narzędzie badań medioznawczych

75%

Maćkiewicz J.

Studia Medioznawcze

|

2020

|

t 21, nr 3 (82)

615-627

Celem artykułu jest pokazanie, w jaki sposób koncepcja ram interpretacyjnych może być zastosowana przy badaniu tekstów medialnych. W części pierwszej przedstawiono, jak rozwijała się ta koncepcja, poczynając od lat 70. ubiegłego wieku aż po dzień dzisiejszy - ze szczególnym uwzględnieniem rozwoju w obrębie nauk o mediach. W części drugiej omówiono definicję ramy oraz rodzaje ram. W części trzeciej zajęto się problemami metodologicznymi związanymi z analizą ramową: wyborem metody badania i wyborem jednostki analizy. Zwrócono uwagę na nieuwzględnianie w analizach ram multimodalnych. W zakończeniu wyliczone zostały kwestie, które przy analizie ramowej wymagają jeszcze rozstrzygnięcia bądź doprecyzowania. (abstrakt oryginalny)