Czasopismo
Tytuł artykułu
Warianty tytułu
Automatic Classification of the Messages e-mail with Applying Decision Tables
Języki publikacji
Abstrakty
W artykule zaproponowano metodę dotyczącą automatycznej klasyfikacji wiadomości mailowych w skrzynkach pocztowych. Celem pracy jest opracowanie mechanizmu tworzenia tabel decyzyjnych ze zbiorów takich wiadomości e-mail, na których możliwe jest zbudowanie klasyfikatora, którego zastosowanie pozwala na poprawienie dokładności klasyfikacji wiadomości e-mail do folderów. Zaproponowana metoda została przetestowana na zbiorze danych Enron E-mail przy zastosowaniu wybranych algorytmów. Uzyskane wyniki potwierdzają, że użycie proponowanych rozwiązań pozwala na poprawienie dokładności klasyfikacji nowych wiadomości e-mail do folderów.(abstrakt oryginalny)
In this article is proposed an approach to an automatic classification of e-mail messages in mailboxes. The aim of the study is to develop a method to building decision tables from the set of e-mail messages, for which it is possible to building a classifier, whose application allows to improve the accuracy of the classification of e-mail folders. The proposed method has been tested on a set of data Enron E-mail using selected algorithms. The obtained results confirm that this approach allows one to improve the accuracy with which new emails are assigned to particular folders.(original abstract)
Rocznik
Numer
Strony
16--30
Opis fizyczny
Twórcy
autor
- Uniwersytet Ekonomiczny w Katowicach
autor
- Uniwersytet Śląski w Katowicach
autor
- Uniwersytet Śląski w Katowicach
autor
- Uniwersytet Śląski w Katowicach
Bibliografia
- Bekkerman R., McCallum A., Huang G. (2004), Automatic Categorization of Email into Folders: Benchmark Experiments on Enron and SRI Corpora, Center for Intelligent Information Retrieval, Technical Report IR.
- Breiman L., Friedman J.H., Olshen R.A., Stone C.J. (1984), Classification and Regression Trees, Chapman & Hall, New York.
- Clark P., Niblett T. (1989), The CN2 Induction Algorithm, Machine Learning.
- Cortes C., Vapnik V. (1995), Support-vector Networks, Machine Learning.
- Holland J.H. (1975), Adaptation in Natural and Artificial Systems: An Introductory Analysis with Applications to Biology, Control and Artificial Intelligence, MIT Press, Cambridge.
- Kiritchenko S., Matwin S. (2002), Email Classification with Co-training, Tech. rep., University of Ottawa.
- Lewis D.D. (1992), Representation and Learning in Information Retrieval, Ph.D. thesis, Department of Computer Science, University of Massachusetts.
- Payne T.R., Edwards P. (1997), Interface Agents that Learn an Investigation of Learning Issues in a Mail Agent Interface, Applied Artificial Intelligence.
- Sahami M., Dumais S., Heckerman D., Horvitz E.(1998), A Bayesian Approach to Filtering Junk E-mail, Learning for Text Categorization: Papers from the 1998 Workshop.
Typ dokumentu
Bibliografia
Identyfikatory
Identyfikator YADDA
bwmeta1.element.ekon-element-000171389545