کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6856176 1437948 2018 36 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Multi-label semi-supervised classification through optimum-path forest
ترجمه فارسی عنوان
طبقه بندی نیمه نظارت چند برچسب از طریق جنگل بهینه مسیر
کلمات کلیدی
یادگیری نیمه نظارتی، تکلیف چند برچسب، طبقه بندی جنگل بهینه مسیر،
ترجمه چکیده
طبقه بندی چند لایه شامل اعطای یک یا چند کلاس به هر نمونه در یک مجموعه داده اختصاص داده می شود. با این حال، پروژه یک طبقه بندی چند لایک معمولا به تعداد کمی از نمونه های نظارت شده در مقایسه با تعدادی از همه ترکیبات ممکن برچسب محدود می شود. این سناریو از روش یادگیری نیمه نظارتی برخوردار است که می تواند با عدم وجود نمونه های تحت نظارت با افزودن کنترل های ناخواسته به مجموعه آموزشی تمرکز کند. به تازگی، ما یک روش یادگیری نیمه نظارتی را براساس اتصال بهینه برای طبقه بندی تک برچسب پیشنهاد دادیم. در این کار، ما آن را برای طبقه بندی چند لایک با افزایش قابل ملاحظه بهره وری گسترش می دهیم. پس از یک تبدیل داده تک برچسب، روش، برچسب ها را از نمونه های تحت نظارت به نمونه های نا منظم، همانند روش اصلی، با فرض اینکه نمونه هایی از همان کلاس از طریق توالی نمونه های نزدیک تر از نمونه هایی از کلاس های مجزا، نزدیکتر هستند، منتشر می شود. با توجه به این که این روش در مناطق با تراکم بالا از فضای ویژگی قابل اعتماد تر است، یک مرحله اضافی برچسب ها را از حداکثر یک تابع چگالی احتمال برای اصلاح خطاهای احتمالی برچسب زدن از مرحله قبلی باز می کند. در نهایت، تبدیل داده ها برای به دست آوردن برچسب های متعدد در هر نمونه معکوس می شود. رویکرد جدید در مقایسه با روش های پیشرفته، بر روی چندین مجموعه داده اعتبار سنجی شده است.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Multi-label classification consists of assigning one or multiple classes to each sample in a given dataset. However, the project of a multi-label classifier is usually limited to a small number of supervised samples as compared to the number of all possible label combinations. This scenario favors semi-supervised learning methods, which can cope with the absence of supervised samples by adding unsupervised ones to the training set. Recently, we proposed a semi-supervised learning method based on optimum connectivity for single-label classification. In this work, we extend it for multi-label classification with considerable effectiveness gain. After a single-label data transformation, the method propagates labels from supervised to unsupervised samples, as in the original approach, by assuming that samples from the same class are more closely connected through sequences of nearby samples than samples from distinct classes. Given that the procedure is more reliable in high-density regions of the feature space, an additional step repropagates labels from the maxima of a probability density function to correct possible labeling errors from the previous step. Finally, the data transformation is reversed to obtain multiple labels per sample. The new approach is experimentally validated on several datasets in comparison with state-of-the-art methods.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Sciences - Volume 465, October 2018, Pages 86-104
نویسندگان
, , ,