کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
406194 678069 2015 15 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Comparison of two topological approaches for dealing with noisy labeling
ترجمه فارسی عنوان
مقایسه دو رویکرد توپولوژیک برای برخورد با مارک پر سر و صدا
کلمات کلیدی
شناسایی نمونه نامناسب آرامش لبه های برش وزن یادگیری توپولوژیک، شاخص جداگانه، فراگیری ماشین
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی

This paper focuses on the detection of likely mislabeled instances in a learning dataset. In order to detect potentially mislabeled samples, two solutions are considered which are both based on the same framework of topological graphs. The first is a statistical approach based on Cut Edges Weighted statistics (CEW) in the neighborhood graph. The second solution is a Relaxation Technique (RT) that optimizes a local criterion in the neighborhood graph. The evaluations by ROC curves show good results since almost 90% of the mislabeled instances are retrieved for a cost of less than 20% of false positive. The removal of samples detected as mislabeled by our approaches generally leads to an improvement of the performances of classical machine learning algorithms.

ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Neurocomputing - Volume 160, 21 July 2015, Pages 3–17
نویسندگان
, , , ,