Ograniczanie wyników
Czasopisma help
Autorzy help
Lata help
Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników

Znaleziono wyników: 70

Liczba wyników na stronie
first rewind previous Strona / 4 next fast forward last
Wyniki wyszukiwania
Wyszukiwano:
w słowach kluczowych:  Eksploracja tekstu
help Sortuj według:

help Ogranicz wyniki do:
first rewind previous Strona / 4 next fast forward last
Niniejszą pracę rozpoczyna prezentacja podstawowych zagadnień związanych z text miningiem. Przedstawiona zostanie jego definicja, związki z innymi metodami badań oraz krótki przegląd problemów badawczych rozpatrywanych na jego gruncie. Kolejny punkt pracy dotyczy metod pozyskiwania informacji z dokumentów tekstowych i sposobów jej reprezentacji. Kontynuacją tego zagadnienia są rozważania zawarte w następnej części pracy, które dotyczą sposobów wykorzystania pozyskanych informacji w procesie analizy. Poruszone w artykule problemy zilustrowane zostaną przykładem wykorzystującym rzeczywiste dane tekstowe. Końcowa część pracy zawiera wnioski i spis wykorzystanej literatury. (fragment tekstu)
The development of Internet resulted in an increasing number of online text repositories. In many cases, documents are assigned to more than one class and automatic multi-label classification needs to be used. When the number of labels exceeds the number of the documents, effective label space dimension reduction may significantly improve classification accuracy, what is a major priority in the medical field. In the paper, we propose document clustering for label selection. We use semi-clustering method, by considering graph representation, where documents are represented by vertices and edge weights are calculated according to their mutual similarity. Assigning documents to semi-clusters helps in reducing number of labels, further used in multi-label classification process. The performance of the method is examined by experiments conducted on real medical datasets. (original abstract)
Hermeneutyka jest sztuką, umiejętnością opartą na regułach. Umiejętność ta dotyczy interpretacji, czyli rozumienia w szczególny - własny - sposób tekstu: wszelkiej całości semantycznej. Reguły sztuki interpretacji, to tekstocentryczność - pomijanie osoby autora; oraz pretekstualność - uznanie tekstu za możliwość urzeczywistnianą w świadomości odbiorczej. (abstrakt oryginalny)
Celem pracy jest zidentyfikowanie unikatowych atrybutów wybranych miast Europy Środkowo-Wschodniej obecnych w opiniach zamieszczonych na portalu TripAdvisor [https://www.tripadvisor.co.uk]. Pobrano opinie dotyczące centrów turystycznych wybranych miast (kategoria Things to do...) - obszarów, w których koncentruje się ruch turystyczny w miastach: w zabytkowym centrum, na starym mieście, na starym rynku. Do badań wybrano najpopularniejsze pod względem turystycznym miasta Europy Środkowo-Wschodniej: Poznań, Wrocław, Kraków, Warszawę oraz Pragę, Bratysławę i Wiedeń. Łącznie pobrano 28 794 opinie. Procedurą Text Mining zliczono najczęstsze wyrazy pojawiające się w opiniach. Analiza wariancji ujawniła 76 unikatowych słów, które poddano analizie korespondencji. Wśród badanych miast najwięcej unikatowych słów-atrybutów ma Bratysława, najmniej zaś Praga. Zbliżone do siebie pod względem atrybutów wizerunku są: Poznań, Wrocław i Praga, a w drugiej grupie - Warszawa i Bratysława. Wiedeń i Kraków nie wykazują podobieństwa z pozostałymi miastami.(abstrakt oryginalny)
Miary semantycznego podobieństwa pojęć można podzielić na dwa rodzaje: metody oparte na wiedzy i metody oparte na bazie tekstów. Techniki oparte na wiedzy stosują stworzone przez człowieka słowniki oraz inne opracowania. Techniki oparte na bazie tekstów oceniają podobieństwo semantyczne dwóch pojęć, odwołując się do obszernych baz dokumentów tekstowych. Niektórzy badacze twierdzą, że miary oparte na wiedzy są lepsze jakościowo od tych opartych na bazie tekstów, ale o wiele istotniejsze jest to, że te drugie zależą bardzo mocno od użytej bazy tekstów. W niniejszym artykule przedstawiono propozycję modyfikacji najlepszej metody pomiaru semantycznego podobieństwa pojęć, opartej na sieci WordNet, a mianowicie miary Leacock-Chodorowa. Ta miara była najlepsza w kilku eksperymentach badawczych oraz można zapisać ją za pomocą prostej formuły. Nową propozycję oceniono na podstawie dwóch popularnych benchmarkowych zbiorów par pojęć, tj. zbioru 65 par pojęć Rubensteina-Goodenougha oraz zbioru 353 par pojęć Fickelsteina. Wyniki pokazują, że przedstawiona propozycja spisała się lepiej od tradycyjnej miary Leacock-Chodorowa. (abstrakt oryginalny)
Tasks involving the analysis of natural language are typically conducted on a corpus or corpora of plain text. However, it is rare that a document is unstructured and freeform in its entirety. Documents such as corporate disclosures, medical journals and other knowledge rich archive contain structured and loosely-structured information that can be used in a variety of important text mining tasks. In this paper we propose a syntactical preprocessing architecture to serialize presentationoriented documents to a machine readable format that aspires to preserve the document structure, contents and metadata. We introduce a hybrid pipeline architecture, discussing the various processes and the future research direction that could potentially lead to a holistic representation of heterogeneous documents. (original abstract)
Purpose: An attempt to identify the scope of duties of the business analyst by analyzing job offers from websites. Design/methodology/approach: Job offers were automatically downloaded from five websites. An analysis of text mining of fragments of offers describing the scope of duties was carried out. The analysis of text mining included initial text processing, creation of corpora of analyzed documents, creation of a document-term matrix and the use of classic methods derived from data mining. Findings: The most frequently used words/n-grams and the correlation of selected words/ n-grams with other words/n-grams were presented in the form of drawings. Based on the frequency of words/n-grams and the correlation value, efforts were made to identify the responsibilities of the business analyst. Research limitations/implications: Only offers written in Polish, downloaded from five websites with job offers, which had the phrase "business analyst" in their job title, were analyzed. The data was collected between 13 and 15 April 2020. Practical implications: The method applied can be used by organizations preparing for the profession of a business analyst, to modify and better adapt curricula to the needs of the labor market. Originality/value: Studies have shown that text mining of job offers can, to some extent, help determine the responsibilities of a business analyst. (original abstract)
W różnych sytuacjach występuje potrzeba wyróżnienia fragmentu tekstu. W tym celu dostępnych jest wiele różnych technik, między innymi: kolor czcionki, kolor tła, podkreślenie, wielkość i styl czcionki, kapitalizacja. Wytyczne opisujące użycie kolorów w różnych kontekstach można odnaleźć w wielu źródłach. W ciągu ubiegłego stulecia przeprowadzono liczne badania w tej dziedzinie, jednak jak dotąd nie badano wpływu kolorów na intensywność efektu wyróżniania (ang. pop-out effect). Na podstawie przeprowadzonej ankiety i analizy tego zjawiska określony został ranking najlepszych kolorów używanych do wyróżniania tekstu. Zweryfikowane zostały dwie metody (kolor czcionki i kolor tła) dla sześciu podstawowych kolorów. Badanie zostało przeprowadzone dwukrotnie na tej samej grupie respondentów, aby sprawdzić stabilność odpowiedzi. Spójność opinii została zbadana przy użyciu metody AHP. Wyniki wskazują, że istnieją znaczne różnice między kolorami. Preferencje zostały pogrupowane w klasy. Stabilność odpowiedzi została potwierdzona, jednak niektóre wyrażane poglądy nie są spójne. Przeprowadzone badanie stanowi wstęp do omawianego tematu. Wiele czynników pozostaje poza zakresem niniejszego artykułu i stanowi potencjał do dalszych eksperymentów (m.in. specyfika kulturowa, odcienie kolorów, kontekst prezentacji). (abstrakt oryginalny)
Niniejsza publikacja oferuje wgląd w doświadczenia widzów związane z konsumpcją filmów należących do różnych gatunków, takich jak suspens, western oraz komedia. Badanie zostało przeprowadzone z wykorzystaniem jakościowej i ilościowej analizy text mining recenzji trzech wybranych tytułów filmowych. Wyniki analizy opartej na text mining uzupełnia badanie jakościowe recenzji filmowych. Wyniki badania pozwoliły na uchwycenie spektrum czynników oddziałujących na doświadczenia widzów na różnych etapach konsumpcji produktu, jakim jest film - podróży zakupowej konsumenta. Czynniki te związane są m.in. z cechami produktu (np. marka reżysera, gwiazdorska obsada, ścieżka dźwiękowa, historyczny kontekst fabuły filmu) oraz różnymi punktami "kontaktu" kreującymi doświadczenia widza (np. kanał dystrybucji filmu). Wyodrębnione kategorie doświadczeń widza odpowiadają analizowanym gatunkom filmowym. Prezentowane w niniejszej publikacji badanie ma charakter badań wstępnych, eksploracyjnych. (abstrakt oryginalny)
Objective: The objective of the paper is to analyse publicly available government policy documents of the United Arab Emirates (UAE) and the Kingdom of Saudi Arabia (KSA) in order to identify key topics and themes for these two countries in relation to the COVID-19 response. Research Design & Methods: In view of the availability of large volumes of documents as well as advancement in computing system, text mining has emerged as a significant tool to analyse large volumes of unstructured data. For this paper, we have applied latent semantic analysis and Singular Value Decomposition (SVD) for text clustering. Findings: The results of the analysis of terms indicate similarities of key themes around health and pandemic for the UAE and the KSA. However, the results of text clustering indicate that focus of the UAE' documents in on 'Digital'-related terms, whereas for the KSA, it is around 'International Travel'-related terms. Further analysis of topic modelling demonstrates that topics such as 'Vaccine Trial', 'Economic Recovery', 'Health Ministry', and 'Digital Platforms' are common across both the UAE and the KSA. Contribution / Value Added: The study contributes to text-mining literature by providing a framework for analyzing public policy documents at the country level. This can help to understand the key themes in policies of the governments and can potentially aid the identification of the success and failure of various policy measures in certain cases by means of comparing the outcomes. Implications / Recommendations: The results of this study clearly showed that text clustering of unstructured data such as policy documents could be very useful for understanding the themes and orientation topics of the policies. (original abstract)
11
Content available remote Identification of Technologies in Industry 4.0 With the Use of Text Mining
75%
Purpose: The objective of this paper is to identify leading technologies in Industry 4.0. Design/methodology/approach: The identification was made with the use of text mining to explore the scientific texts in this field. Assumptions of own iterative method for analyzing scientific texts were proposed, with the use of R language, tokenization, lemmatization, n-grams and correspondence analysis. The assumptions of the proposed method were used to analyze the 40 most often quoted articles indexed in the Web of Science. Findings: On the basis of the obtained results, 4 leading technologies were identified. These are Cloud Computing, Internet of Things, Cyber-physical System and Big Data. Originality/value: The article proposes an original method of identifying the leading technologies used in Industry 4.0. The proposed method is based on text mining and correspondence analysis. (original abstract)
Artykuł zawiera przykład zastosowania metod klasteringu i analizy text-miningu artykułów opublikowanych w języku angielskim w wydawnictwie Studia i Materiały Polskiego Stowarzyszenia Zarządzania Wiedzą. Text-mining stanowi metodę pozyskiwania wiedzy z danych tekstowych. W ramach tego procesu osiągamy efekt kreowania nowej wiedzy z tekstu. W pracy zamieszczono interpretację zastosowania metody klasteringu w procesie ekstrakcji wiedzy poprzez analizę podobieństwa treści ekstraktu tekstu oraz struktury badanych artykułów. Poprzez analizę stworzono możliwość wykonania serii symulacji pozwalających dokonać oceny wpływu zmian liczby klastrów na powstawanie i liczebność grup homogenicznych. (abstrakt oryginalny)
Objective: In our study, we analyze Central and Eastern European (CEE) scientific papers published in peer-reviewed scientific journals between 2015 and 2021. We examine what category systems and methods are used in Central and Eastern European start-up researches in the recent years.Methodology: Our used methodology was structured literature review analysis and artificial intelligence-based natural language processing which is one of the most evolving methodological directions in economics and social sciences at present but it is very rarely used in review analysis of startup research.Value Added: The NLP method has not been widely used for the analysis of the startup literature. Furthermore, our study is the first which analyzes CEE startups research with NLP technique.Findings: Based on our results, it can be stated that CEE startup researches follow the big global startup research narratives. However, a specific conceptual network is also emerging which contains several shifts of emphasis compared to the directions of global research. (original abstract)
Purpose: The paper presents an analysis of a scientific publication with regard to the frequency of words and n-grams. The research problem addressed was the question to what extent the text mining analysis of a scientific publication will allow to infer its content. Design/methodology/approach: The main research method is the analysis of tokenized text using word count functions, bigrams, and trigrams in selected sections of a scientific publication. The results of text mining analysis were compared with the classic, non-automated text analysis of the publication. The presented study is a pilot project in the form of a case study. Findings: The proposed method of analyzing a scientific text using an analysis of the frequency of words and n-grams enables inference of the content of the paper with regard to the names of variables involved in the study, the statistical apparatus used and the key literature cited. It should be observed, however, that the discussed method does not make it possible to establish which variables are moderators and which are mediators. Originality/value: In this paper, the text mining technique was used differently in the discussed study than in previous works. The publication was not examined in its entirety, as previous researchers did, but text mining analysis was applied to individual parts of the paper, i.e. the part discussing theoretical foundations of the research and the part presenting the research method, research results, and their discussion. This allowed for obtaining more precise results regarding the content of the publication. (original abstract)
15
Content available remote Kierunki rozwoju badań zarządzania jakością
75%
Artykuł przedstawia analizę zmian w zainteresowaniach badawczych w obszarze zarządzania jakością. Celem artykułu jest odkrycie nowych lub zmodyfikowanych kierunków badań, które pojawiły się w latach 2020-21. Jest on rozwinięciem wcześniejszych badań nad trendami w zarządzaniu jakością. Wykorzystano narzędzia eksploracji tekstu. Wybrano 2399 artykułów naukowych z 13 wiodących czasopism poświęconych tematyce jakości notowanych w Scopus. Wskazano 6 nowych lub zmodyfikowanych kierunków badań. Ponadto wskazano na rosnące zainteresowanie tematyką przemysłu 4.0 i jakości 4.0. (abstrakt oryginalny)
Zwiększanie stopnia swobody w kształtowaniu procesu dydaktycznego na uczelniach wyższych wymaga coraz więcej sprawności w zarządzaniu wiedzą o procesie dydaktycznym. Głównym motywem prac autorek nad analizą treści programowych było wykrywanie nadmiernego powtarzania treści programowych na danej ścieżce kształcenia. Podczas tych prac autorki posiłkowały się metodami statystycznymi. Otrzymane wyniki pozwoliły na zweryfikowanie treści programowych przedmiotów zawartych w sylabusach oraz wstępne rozpoznanie zadania automatyzacji analizy zawartości sylabusów z użyciem metod text mining. Rozważania dotyczące rozszerzenia istniejącego systemu wspomagającego tworzenie sylabusów o metody weryfikacji ich treści oraz wstępna koncepcja takiego systemu zawarta została w końcowej części niniejszego artykułu. (abstrakt oryginalny)
Wraz z rozwojem internetu, mediów społecznościowych oraz technologii mobilnych znacznie wzrosła ilość generowanych danych. Dane te, zarówno w formie ustrukturalizowanej, jak i nieustrukturalizowanej, mogą nieść wartość biznesową dla przedsiębiorców. W danych big data można znaleźć m.in. informacje na temat klientów, konkurencji, rynku pracy, opinii na temat produktów danej firmy, czy aktualnych trendów. Dzięki dokładnej analizie internetu i mediów społecznościowych, interesariusze mogą pozyskać nową wartość, jaką są informacje na temat nastawienia i opinii konsumentów. Celem artykułu jest przedstawienie narzędzi big data jako jednego ze sposobów analizy mediów społecznościowych i wyciągania w ten sposób wartościowych informacji. Przedmiotem przeprowadzonej analizy były tysiące tweetów użytkowników portalu Twitter. Analiza została przeprowadzona przy wykorzystaniu technik text mining oraz sentyment analysis.(abstrakt oryginalny)
18
75%
Purpose: An attempt to identify the duties and responsibilities of the project manager by analysing job offers from a job website. An attempt to determine whether there were any changes between 2018 and 2019. Design/methodology/approach: Text mining was performed for fragments of job offers, describing the duties and responsibilities. The text mining analysis consisted of initial processing of the text, creation of a corpus of analysed documents, construction of a word frequency matrix and use of classical methods from the data mining are. Findings: The most common words in job offers are presented, as well as their correlation with other words. With the use of the Topic modeling algorithm, hidden topics describing the analysed job offers have been generated. These topics can also be used to identify the duties and responsibilities of a project manager. Research limitations/implications: Only the job offers meeting the following conditions were analysed: (1) they concerned the job of "project manager"; (2) the content was in Polish; (3) they were provided by www.pracuj.pl website; (4) they were collected from 09 to 11 April in 2018 and 2019. Practical implications: This method can be used by organizations training project managers, in order to modify and better adjust the curriculum to the needs of the labour market. Originality/value: Research has shown that text mining can be used to determine the responsibilities of a project manager by analysing job offers. (original abstract)
19
Content available remote Defining Innovation with Text-Mining
75%
W artykule zostały wykorzystane metody analizy danych tekstowych do przedstawienia sposobu postrzegania podejścia do innowacji w wiadomościach pochodzących z Polski, Stanów Zjednoczonych i Chin. Przedstawiono proces analizy składający się pozyskiwania danych, czyszczenia oraz analiz w aplikacji Rapidminer. Wyniki zostały przedstawione za pomocą grafów ISOM przedstawiających podejście do innowacji w wymienionych wcześniej krajach.(abstrakt oryginalny)
Celem artykułu jest pokazanie, w jaki sposób koncepcja ram interpretacyjnych może być zastosowana przy badaniu tekstów medialnych. W części pierwszej przedstawiono, jak rozwijała się ta koncepcja, poczynając od lat 70. ubiegłego wieku aż po dzień dzisiejszy - ze szczególnym uwzględnieniem rozwoju w obrębie nauk o mediach. W części drugiej omówiono definicję ramy oraz rodzaje ram. W części trzeciej zajęto się problemami metodologicznymi związanymi z analizą ramową: wyborem metody badania i wyborem jednostki analizy. Zwrócono uwagę na nieuwzględnianie w analizach ram multimodalnych. W zakończeniu wyliczone zostały kwestie, które przy analizie ramowej wymagają jeszcze rozstrzygnięcia bądź doprecyzowania. (abstrakt oryginalny)
first rewind previous Strona / 4 next fast forward last
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.