PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2010 | nr 3 | 117--133
Tytuł artykułu

Metodyka procesu eksploracji danych SEMMA

Warianty tytułu
SEMMA Data Mining
Języki publikacji
PL
Abstrakty
Artykuł przedstawia jedną z metodyk realizacji Data Mining zwaną SEMMA. Metodyka ta w prosty i skuteczny sposób wspomaga przeprowadzanie złożonego procesu, jakim jest eksploracja danych. Została opracowana i zaimplementowana przez producenta oprogramowania do eksploracji danych Enterprise Miner, amerykańską firmę SAS Institute, Inc.. Opisano tutaj dokładnie kroki postępowania, które składają się na tą metodologię czyli Sample, Explore, Modify, Model, Assess. Do każdego z tych etapów przedstawiono poszczególne narzędzia operowania danymi. Dla Sample są to Input Data Source, Sampling, Data Partition. Narzędzia Explore to Distribution Explorer, Multiplot, Insight, Association, Variable Selection, Link Analysis. Do etapu Modify zaliczamy narzędzia Data Set Attributes, Transform Variables, Filter Outliers, Re-placement, Clustering, SOM/Kohonen, Tim Series. Narzędzia Model to Regression, Tree, Neural Network, Princomp/Dmneural, User Defined Model, Ensemble, Memory-Based Reasoning, Two Stage Model. Narzędzia ostatniego etapu Assess to Assessment i Reporter. Oprócz narzędzi należących do kroków metodyki SEMMA opisano także narzędzia z dwóch grup węzłów: Scoring i Utility. Zaprezentowano także reguły, których należy przestrzegać przy budowie diagramów analizy danych. Dla ilustracji przetwarzania według metodyki SEMMA przedstawiono przykład analizy Data Mining za pomocą narzędzi SAS Enterprise Miner. Przykład dotyczy prognozowania posiadania komputera z dostępem do Internetu w gospodarstwach domowych na podstawie wybranych cech gospodarstwa. Porównywana jest jakość dwóch modeli predyktywnych: regresji logistycznej i sieci neuronowych. (abstrakt oryginalny)
EN
The article presents the Data Mining process based on SEMMA methodology. It regards matching of the data mining process to the general strategy of problems solution by the business or research unit. Ali six stages are characterized on the base of the best practices. The article will facilitate the successful application of SEMMA methodology in practice. (original abstract)
Słowa kluczowe
Rocznik
Numer
Strony
117--133
Opis fizyczny
Twórcy
  • Uniwersytet Warszawski
  • Uniwersytet Warszawski
Bibliografia
  • Berry M.J.A., Linoff G.S. (2004), Data Mining Techniques. For Marketing, Sales, and Customer Relationship Management, 2nd ed., Wiley Publishing.
  • Data Mining Using SAS Enterprise Miner: A Case Study Approach, Second Edition (2004), SAS Institute Inc.
  • Enterprise Miner Reference Help (2005), SAS Institute Inc.
  • Giudici P. (2003), Applied Data Mining. Statistical Methods for Business and Industry, Wiley.
  • Hand D., Mannila H., Smyth P. (2001), Principles of Data Mining, Massachusetts Institute of Technology.
  • Kovalerchuk B., Vityaev E. (2000), Data Mining in Finance. Advances in Relational and Hybrid Methods, Kluwer.
  • Kudyba S. (2004), Managing Data Mining. Advice from Experts, IT Solutions Series, CyberTech Publishing, Idea Group Inc.
  • Larose D.T. (2008), Metody i modele eksploracji danych, Wydawnictwo Naukowe PWN, Warszawa.
  • Lasek M. (2007), Metody Data Mining w analizowaniu i prognozowaniu kondycji ekonomicznej przedsiębiorstw. Zastosowania SAS Enterprise Miner, Difin, Warszawa.
  • Maimon O., Kokach L. (eds.) (2005), Data Mining and Knowledge Discovery Handbook, Springer, New York.
  • Matignon R. (2007), Data Mining Using SAS Enterprise Miner, John Wiley & Sons, New Jersey.
  • Shmueli G., Patel N.R., Bruce P. (2007), Data Mining for Business Intelligence, Wiley & Sons, New Jersey.
  • Wang J. (ed.) (2003), Data Mining. Opportunities and Challenges, IRM Press.
  • Witten J.H., Frank E. (2000), Data Mining. Practical Machine Learning Tools and Techniques with Java Implementations, Academic Press, Morgan Kaufmann Publishers.
  • Ye N. (ed.) (2003), The Handbook of Data Mining, Lawrence Erlbaum Associates, New Jersey.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171201863

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.