کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6864812 1439552 2018 20 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Self-training semi-supervised classification based on density peaks of data
ترجمه فارسی عنوان
طبقهبندی نیمه نظارت خودآموزی براساس قله تراکم اطلاعات
کلمات کلیدی
ترجمه چکیده
داشتن بسیاری از داده های بدون برچسب و چند علامت گذاری آنها یک مشکل رایج در بسیاری از کاربردهای عملی است. یک روش موفق برای مقابله با این مشکل، طبقه بندی نیمه نظارت خودآموزی است. در این مقاله، ما یک روش برای کشف ساختار فضای داده بر اساس پیدا کردن قله تراکم ارائه می کنیم. سپس، یک چارچوب برای طبقه بندی نیمه نظارت خودآموزی که در آن ساختار فضای داده در فرآیند تکرار خودآموز یکپارچه برای کمک به تربیت طبقه بندی بهتر پیشنهاد شده است، پیشنهاد شده است. مجموعه ای از آزمایشات در هر دو مجموعه داده های مصنوعی و واقعی برای ارزیابی عملکرد چارچوب پیشنهادی ما اجرا می شود. نتایج تجربی به وضوح نشان می دهد که چارچوب پیشنهادی ما عملکرد بهتر نسبت به برخی از آثار قبلی را به طور کلی در هر دو مجموعه داده های مصنوعی و واقعی، به ویژه هنگامی که توزیع داده ها غیر کروی است. علاوه بر این، ما همچنین می بینیم که دستگاه بردار پشتیبانی به ویژه برای چارچوب پیشنهاد شده ما به عنوان نقش طبقه بندی پایه ای بازی می کند.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Having a multitude of unlabeled data and few labeled ones is a common problem in many practical applications. A successful methodology to tackle this problem is self-training semi-supervised classification. In this paper, we introduce a method to discover the structure of data space based on find of density peaks. Then, a framework for self-training semi-supervised classification, in which the structure of data space is integrated into the self-training iterative process to help train a better classifier, is proposed. A series of experiments on both artificial and real datasets are run to evaluate the performance of our proposed framework. Experimental results clearly demonstrate that our proposed framework has better performance than some previous works in general on both artificial and real datasets, especially when the distribution of data is non-spherical. Besides, we also find that the support vector machine is particularly suitable for our proposed framework to play the role of base classifier.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Neurocomputing - Volume 275, 31 January 2018, Pages 180-191
نویسندگان
, , , , , , ,