دانلود رایگان مقاله: مجموعه گروه بندی خوشه بندی برای داده های طبقه بندی شده بر اساس شاخص های اعتبار درونی

کد مقاله	کد نشریه	سال انتشار	مقاله انگلیسی	نسخه تمام متن
4969676	1449978	2017	37 صفحه PDF	دانلود رایگان

عنوان انگلیسی مقاله ISI

Clustering ensemble selection for categorical data based on internal validity indices

ترجمه فارسی عنوان

مجموعه گروه بندی خوشه بندی برای داده های طبقه بندی شده بر اساس شاخص های اعتبار درونی

دانلود مقاله + سفارش ترجمه

دانلود مقاله ISI انگلیسی

رایگان برای ایرانیان

کلمات کلیدی

مجموعه گروه بندی خوشه بندی داده های طبقه بندی شده شاخص های اعتبار خوشه بندی، کیفیت، تنوع

Diversity - تنوع Categorical data - داده های طبقه بندی شده Quality - کیفیت

ترجمه چکیده

انتخاب گروه خوشه بندی یک روش موثر برای بهبود کیفیت نتایج خوشه بندی است. با این حال، روش های سنتی معمولا کیفیت و تنوع بر اساس خوشه خوشه خوشه بندی پایه را اندازه می گیرند در حالی که اطلاعات مربوط به داده های اصلی را از دست می دهند. برای حل این مشکل، یک الگوریتم انتخاب گروهی جدید برای خوشه بندی داده ها ارائه شده است. در این الگوریتم، پنج شاخص معتبر داخلی و اطلاعات متقابل نرمال شده برای اندازه گیری کیفیت و تنوع خوشه بندی پایه استفاده می شود. با توجه به اندازه گیری کیفیت، پارتیشن با بیشترین مقدار، برای شرکت در گروه اول انتخاب می شود. سپس، پارتیشن های پایه با بالاترین کیفیت و تنوع خوشه بندی نسبت به پارتیشن های پایه انتخاب شده در تکرارهای قبلی، به طور تکراری انتخاب می شوند تا اندازه خوشه بندی پایه انتخاب شده رضایت بخش باشد. اثربخشی و استحکام الگوریتم پیشنهادی در مقایسه با مجموعه کامل، گروه انتخاب تصادفی و الگوریتم های جمع آوری حالت های پیشرفته ارزیابی می شود. نتایج تجربی در مجموعه داده های واقعی قطعی نشان می دهد که الگوریتم پیشنهادی با الگوریتم های انتخاب موجود گروه از نظر کیفیت خوشه ای رقابتی است.

موضوعات مرتبط

مهندسی و علوم پایه مهندسی کامپیوتر چشم انداز کامپیوتر و تشخیص الگو

پیش نمایش مقاله

مجموعه گروه بندی خوشه بندی برای داده های طبقه بندی شده بر اساس شاخص های اعتبار درونی

چکیده انگلیسی

Clustering ensemble selection is an effective technique for improving the quality of clustering results. However, traditional methods usually measure the quality and diversity based on the cluster labels of base clusterings while missing the information of the original data. To solve this problem, a new clustering ensemble selection algorithm for categorical data is presented. In this algorithm, five popular internal validity indices and the normalized mutual information are utilized to measure the quality and diversity of the base clusterings, respectively. According to the quality measure, the partition with the highest value is firstly selected to participate in the ensemble. Then, the base partitions with the highest clustering quality and diversity with respect to the selected base partitions in previous iterations are iteratively selected, until the size of selected base clusterings is satisfied. The effectiveness and robustness of the proposed algorithm are evaluated in comparison with full ensemble, random selection ensemble and the state-of-the-art ensemble selection algorithms. Experimental results on real categorical data sets show that the proposed algorithm is competitive with the existing ensemble selection algorithms in terms of clustering quality.

ناشر

Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Pattern Recognition - Volume 69, September 2017, Pages 150-168

نویسندگان

Xingwang Zhao, Jiye Liang, Chuangyin Dang,

علوم انسانی و هنر

فنی، مهندسی و علوم پایه

پزشکی و سلامت

بیو تکنولوژی

پذیرش سفارش ترجمه

دانلود رایگان مقاله ISI : مجموعه گروه بندی خوشه بندی برای داده های طبقه بندی شده بر اساس شاخص های اعتبار درونی

دسترسی سریع

ارتباط

English Website