کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6861655 1439256 2018 37 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Cluster validation using an ensemble of supervised classifiers
ترجمه فارسی عنوان
اعتبارسنجی خوشه با استفاده از مجموعه ای از طبقه بندی های تحت نظارت
کلمات کلیدی
خوشه بندی شاخص اعتبار خوشه، گروه سازنده
ترجمه چکیده
یک شاخص اعتبار خوشه ای برای انتخاب الگوریتم خوشه بندی برای درخواست یک مشکل استفاده می شود. این کار با ارزیابی کیفیت یک پارتیشن، به عنوان خروجی توسط یک الگوریتم خوشه خوشه، در حال گرفتن در مورد مورد معمول از فقدان متخصص در زمینه حوزه گفتگو کار می کند. بسیاری از شاخص های اعتبار موجود، پیش فرض ها را شامل می شوند، مانند هر خوشه ای از پارتیشن دارای یک ساختار زیر، به عنوان مثال، ابررسفره، ارزیابی های نادرست زمانی که آنها را نگه ندارد. در اینجا، ما یک رویکرد اعتبار خوشه ای جدید ارائه می دهیم که تلاش می کند از این تعصب ها با استفاده از مجموعه ای از طبقه بندی های نظارت شده مجزا جلوگیری شود؛ به این ترتیب تعصب به یک طبقه بندی خاص مربوط نیست، بلکه به مجموعه ای از آن، از این رو کم کردن مشکل است. منطق پشت شاخص ما این است که یک پارتیشن خوب باید ساختن یک طبقه بندی خوب را نیز منجر شود؛ بهتر است که عملکرد طبقه بندی، کیفیت پارتیشن تحت ارزیابی بهتر باشد. توجه کنید که چگونه ما از پارتیشن استفاده می کنیم که به عنوان نوعی مجموعه داده برچسب گذاری شده است، جایی که هر شی با برچسب خوشه ای که متعلق به آن است، برچسب گذاری می شود. ما شاخص ما را در 50 مجموعه داده های عددی آزمایش کرده ایم و با استفاده از شش الگوریتم خوشه بندی مختلف گروه بندی شده است. در آزمایشات ما، شاخص ما پنج شاخص روندی، از جمله محبوب ترین آن ها را بهتر می کند.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
A cluster validity index is used to select which clustering algorithm to apply for a given problem. It works by evaluating the quality of a partition, as output by a candidate clustering algorithm, getting around the common case of the lack of an expert in the given domain of discourse. Most existing validity indexes make assumptions, such as each cluster of the partition having an underlying structure, for example, a hypersphere, yielding incorrect evaluations when they do not hold. Here, we propose a new cluster validity index, which attempts to avoid this bias using an ensemble of distinct supervised classifiers; this way the bias is not attributable to a specific classifier, but to a collection thereof, hence alleviating the problem. The rationale behind our index is that a good partition should induce the construction of also a good classifier; the better the classification performance, the better the quality of the partition under evaluation. Notice how we use the partition to be assessed as a sort of labeled dataset, where each object is labeled with the cluster label it belongs to. We have tested our index on 50 numerical datasets, grouped using six different clustering algorithms. In our experiments, our index outperforms five validity indexes, including the most popular ones.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Knowledge-Based Systems - Volume 145, 1 April 2018, Pages 134-144
نویسندگان
, , , , ,