کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
4947485 | 1439578 | 2017 | 25 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
An evaluation study on text categorization using automatically generated labeled dataset
ترجمه فارسی عنوان
یک مطالعه ارزیابی طبقه بندی متن با استفاده از مجموعه داده های برچسب گذاری شده به صورت خودکار تولید می شود
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
استخراج متن، طبقه بندی متن، فراگیری ماشین، ارزیابی، انتخاب ویژگی، مجموعه معیار،
موضوعات مرتبط
مهندسی و علوم پایه
مهندسی کامپیوتر
هوش مصنوعی
چکیده انگلیسی
Naïve Bayes, k-nearest neighbors, Adaboost, support vector machines and neural networks are five among others commonly used text classifiers. Evaluation of these classifiers involves a variety of factors to be considered including benchmark used, feature selections, parameter settings of algorithms, and the measurement criteria employed. Researchers have demonstrated that some algorithms outperform others on some corpus, however, inconsistency of human labeling and high dimensionality of feature spaces are two issues to be addressed in text categorization. This paper focuses on evaluating the five commonly used text classifiers by using an automatically generated text document collection which is labeled by a group of experts to alleviate subjectivity of human category assignments, and at the same time to examine the influence of the number of features on the performance of the algorithms.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Neurocomputing - Volume 249, 2 August 2017, Pages 321-336
Journal: Neurocomputing - Volume 249, 2 August 2017, Pages 321-336
نویسندگان
Zhu Dengya, Wong Kok Wai,