PL EN


Preferencje help
Widoczny [Schowaj] Abstrakt
Liczba wyników
2006 | Marketing | 209--226
Tytuł artykułu

Entropijne sposoby podziału drzew klasyfikacyjnych

Warianty tytułu
Języki publikacji
PL
Abstrakty
Niewielka popularność drzew klasyfikacyjnych opartych na mierze entropii nie oznacza wcale, że narzędzie to jest nieskuteczne. Istnieje wiele obszarów związanych z zarządzaniem i marketingiem, w których z sukcesem można wykorzystać ten sposób analizowania danych. Są to głównie aplikacje dotyczące analitycznego CRM oraz analizy danych ze źródeł wtórnych. Do bardzo ważnych obszarów można zaliczyć: efektywniejsze pozyskiwanie klientów (customer acquisition), określenie ich rentowności (customers' profitablity) oraz wsparcie w zakresie sprzedaży krzyżowej i uzupełniającej (cross-selling i up-selling). Kolejne obszary badawcze to chociażby segmentacja klientów, analiza migracji klientów (churn analysis) czy szeroko rozumiany web mining (profilowanie internautów i analiza kolejności odwiedzanych stron - tzw. click stream). Warto również nadmienić, że część analiz wykorzystywana jest przez specjalistów z innych dziedzin. Dotyczy to analizy zdolności kredytowej oraz wykrywania nadużyć (fraud detection). Algorytm C4.5 zaimplementowano m.in. w programie See5 oraz SPSS Clementine. (fragment tekstu)
EN
The small number of entropy-based classification trees does not mean that as a tool they are inefficient. There are plenty of areas related to management and marketing, where this type of data analysis can be applied successfully. These are mostly applications related to the analytical CRM and analysis of secondary source data. The number of crucial areas includes more efficient customer acquisition, definition of customer profitability, and support for cross-selling and up-sell- ing. The research areas where success has been achieved include customer segmentation, churn analysis, and broadly understood web mining (visitor profiling and click stream analysis). Worth mentioning is the fact that some analyses are used by specialists in other fields. This pertains especially to creditworthiness and fraud detection. The C4.5 algorithm was implemented, among others, in the See5 and SPSS Clementine applications. (original abstract)
Twórcy
  • Krakowska Szkoła Wyższa im. Andrzeja Frycza Modrzewskiego w Krakowie
Bibliografia
  • Abramson N., Teoria informacji i kodowania, przeł. J. Nowakowski, W. Sobczak, PWN, Warszawa 1969.
  • Cestnik B., Kononenko I., Bratko I., ASSISTATNT 86: A Knowledge-Elicitation Tool for Sophisticated Users, [w:] Progress in Machine Learning, (red.) I. Bratko, N. Navrac, Sigma Press, Wimslow 1987.
  • Cronan T.P., Glorfeld L.W., Perry L.G., Production System Development for Expert Systems Using a Recursive Partitioning Induction Approach: An Application to Mortgage, Commercial, and Consumer Lending, "Decision Sciences" 1991, Vol. 2, Sep.-Oct.
  • Foster D.P., Stine R.A., Variable Selection in Data Mining: Building a Predictive Model for Bankruptcy, "Journal of the American Statistical Association" 2004, June, Vol. 99.
  • Fu Z. i in., A Genetic Algorithm^Based Approach for Building Accurate Decision Trees, "INFORMS Journal on Computing" 2003, Vol. 15, No. 1, Winter.
  • Gatnar E., Nieparametryczna metoda dyskryminacji i regresji, PWN, Warszawa 2001.
  • Gatnar E., Symboliczne metody klasyfikacji danych, PWN, Warszawa 1998.
  • Gestwicki P., ID3: History, Implementation, and Applications, October 1997, s. 9 (plik pobrano ze strony citeseer.nj.nec.com latem 2004).
  • Hunt E.B., Martin J., Stone P.J., Experiment in Induction, Academic Press, New York 1966.
  • Liang T.P.,Chandler J.S., I Han I.,Roan J., An empirical investigation of some data effects on the classification accuracy of probit, ID3, and neural networks, "Contemporary Accounting Research" 1992, Vol. 9, No. 1, Fall.
  • Mynarski S., Elementy teorii systemów i cybernetyki, PWN, Warszawa 1979.
  • Quinlan J.R., C4.5: Programs for Machine Learning, Morgan Kaufmann, San Mateo, California 1993.
  • Tam K.Y., Kiang M.Y., Managerial Applications of Neural Networks: The Case of Bank Failure Predictions, "Management Sciences" 1992, Vol. 38, No. 7, July.
  • Turney P.D., Cost-Sensitive Classification: Empirical Evaluation of a Hybrid Genetic Decision Tree Induction Algorithm, "Journal of Artificial Intelligence Research" 1995, nr 2.
  • Utgoff P.E., Incremental Induction of Decision Trees, "Machine Learning" 1989, nr 4.
  • Viaene S., Derrig R.A., Baesens B., Dedene G., A Comparison of State- oj-the-Art Classification Techniques for Expert Automobile Insurance Claim Fraud Detection, "The Journal of Risk and Insurance" 2002, Vol. 69, No. 3.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171320843

Zgłoszenie zostało wysłane

Zgłoszenie zostało wysłane

Musisz być zalogowany aby pisać komentarze.
JavaScript jest wyłączony w Twojej przeglądarce internetowej. Włącz go, a następnie odśwież stronę, aby móc w pełni z niej korzystać.