کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
10361296 870090 2015 35 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
A clustering ensemble: Two-level-refined co-association matrix with path-based transformation
ترجمه فارسی عنوان
یک مجموعه خوشه بندی: ماتریس همبستگی دوطرفه با مبادله مبتنی بر مسیر
کلمات کلیدی
خوشه بندی گروه های خوشه ای، ماتریس همکاری معیار مبتنی بر مسیر،
ترجمه چکیده
هدف گروه خوشه بندی این است که پارتیشن های چند پایه را به یک پارتیشن قوی، پایدار و دقیق ترکیب کنیم. یکی از مشکلات کلیدی خوشه بندی گروه، نحوه استفاده از اطلاعات ساختار خوشه در هر پارتیشن پایه است. تجمع شواهد، یک چارچوب موثر است که می تواند پارتیشن های پایه را به یک ماتریس مشترک تبدیل کند. این ماتریس فرکانس یک جفت نقطه را به یک خوشه تقسیم می کند، اما برخی اطلاعات پنهان در پارتیشن های پایه را نادیده می گیرد. در این مقاله، برخی از این اطلاعات را با پالایش ماتریس همکاری ارتباطی از نقطه داده و سطح خوشه پایه آشکار می کنیم. از سطح نقطه داده ها، به دلیل اینکه جفت نقاط در یک خوشه پایه مشابه ممکن است شباهت های متنوعی داشته باشد، مشارکت آنها در ماتریس مشترک می تواند متفاوت باشد. از سطح خوشه ای، از آنجا که خوشه های پایه ممکن است ویژگی های متنوعی داشته باشند، سهم خوشه پایه به طور کلی نیز می تواند متفاوت از سایر خوشه ها باشد. پس از اصلاح، ماتریس همکاری اتصال به ماتریس شباهت مبتنی بر مسیر تبدیل می شود تا اطلاعات بیشتری از ساختار خوشه در ماتریس گنجانده شود. در نهایت، خوشه بندی طیفی به ماتریس برای تولید نتیجه خوشه نهایی اعمال می شود. نتایج تجربی در 8 مجموعه مصنوعی و 8 مجموعه داده واقعی نشان می دهد که گروه خوشه بندی مبتنی بر ماتریس هماهنگی تصفیه شده از برخی از طرح های گروهی پیشرفته تجمیع می کند.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر چشم انداز کامپیوتر و تشخیص الگو
چکیده انگلیسی
The aim of clustering ensemble is to combine multiple base partitions into a robust, stable and accurate partition. One of the key problems of clustering ensemble is how to exploit the cluster structure information in each base partition. Evidence accumulation is an effective framework which can convert the base partitions into a co-association matrix. This matrix describes the frequency of a pair of points partitioned into the same cluster, but ignores some hidden information in the base partitions. In this paper, we reveal some of those information by refining the co-association matrix from data point and base cluster level. From the data point level, as pairs of points in the same base cluster may have varied similarities, their contributions to the co-association matrix can be different. From the cluster level, since the base clusters may have diversified qualities, the contribution of a base cluster as a whole can also be different from those of others. After being refined, the co-association matrix is transformed into a path-based similarity matrix so that more global information of the cluster structure is incorporated into the matrix. Finally, spectral clustering is applied to the matrix to generate the final clustering result. Experimental results on 8 synthetic and 8 real data sets demonstrate that the clustering ensemble based on the refined co-association matrix outperforms some state-of-the-art clustering ensemble schemes.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Pattern Recognition - Volume 48, Issue 8, August 2015, Pages 2699-2709
نویسندگان
, , , ,