کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4947843 1439592 2017 27 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Cluster ensemble selection with constraints
ترجمه فارسی عنوان
انتخاب مجموعه گروهی با محدودیت
کلمات کلیدی
ترجمه چکیده
گروه خوشه بندی به عنوان یک ابزار مهم برای تجزیه و تحلیل داده ها به کار گرفته شده است، که می تواند یک خوشه بندی انضمامی قوی تر و دقیق تر ایجاد کند. در شکل گیری گروه ها، مطالعات تجربی نشان می دهد که گروه های بهتر می توانند به طور همزمان با توجه به کیفیت گروه ها و تنوع در میان اعضای گروه به دست آیند. با این حال، تلاش های پژوهشی کمی برای به اشتراک گذاشتن دانش قبلی در زمینه پیش زمینه پرداخت شده است. در این مقاله ابتدا تحلیلی نظری درباره تأثیر تنوع و کیفیت اعضای گروه ارائه می کنیم. سپس یک چارچوب یکپارچه برای حل مسئله انتخاب مجموعه ای از خوشه بندی مبتنی بر محدودیت پیشنهاد می کنیم که در آن سطح برخی از سطح باید پیوند و محدودیت هایی را که نمی توان به آنها پیوند داد، به عنوان دانش قبلی یا اطلاعات پس زمینه ارائه شده است. ما این مشکل را به عنوان یک مشکل بهینه سازی ترکیبی از لحاظ ثبات در محدودیت ها، تنوع در میان اعضای گروه و کیفیت کلی گروه ها، رسمی می کنیم. چارچوب پیشنهادی ما دو موضوع متمایز و در عین حال مرتبط از خوشه بندی را جمع آوری می کند: خوشه بندی گروهی و خوشه بندی نیمه نظارت. ما روش های مختلفی را برای جستجوی راه حل های با کیفیت بالا مطالعه می کنیم. آزمایشات بر روی مجموعه داده های معیار اثربخشی چارچوب ما را نشان می دهد.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Clustering ensemble has emerged as an important tool for data analysis, by which a more robust and accurate consensus clustering can be generated. On forming the ensembles, empirical studies have suggested that better ensembles can be obtained by simultaneously considering the quality of the ensembles and the diversity among ensemble members. However, little research efforts have been paid to incorporate prior background knowledge. In this paper, we first provide a theoretical analysis on the effect of the diversity and quality of the ensemble members. We then propose a unified framework to solve constraint-based clustering ensemble selection problem, where some instance level must-link and cannot-link constraints are given as prior knowledge or background information. We formalize this problem as a combinatorial optimization problem in terms of the consistency under the constraints, the diversity among ensemble members, and the overall quality of ensembles. Our proposed framework brings together two distinct yet interrelated themes from clustering: ensemble clustering and semi-supervised clustering. We study different techniques for searching high-quality solutions. Experiments on benchmark datasets demonstrate the effectiveness of our framework.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Neurocomputing - Volume 235, 26 April 2017, Pages 59-70
نویسندگان
, , , ,