کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6855600 660780 2016 8 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
A new index for clustering validation with overlapped clusters
ترجمه فارسی عنوان
یک شاخص جدید برای اعتبارسنجی خوشه بندی با خوشه های همپوشانی
کلمات کلیدی
خوشه های همپوشانی، شاخص اعتبارسنجی، اعتبار خارجی، اختلال خوشه،
ترجمه چکیده
شاخص های اعتبار سنجی خارجی اجازه می دهد تا شباهت بین دو راه حل خوشه بندی به مقدار مشخص شود. با شاخص های کلاسیک خارجی، می توان اندازه گیری کرد که چگونه دو راه حل خوشه سازی غیر مجزا، جایی که هر شیء تنها می تواند به یک خوشه واحد متعلق باشد. با این حال، در کاربردهای عملی، برای یک شی بیش از یک برچسب رایج است، بنابراین متعلق به خوشه های همپوشانی است؛ برای مثال، موضوعاتی که به جوامع مختلف در شبکه های اجتماعی تعلق دارند. در این مطالعه، ما یک شاخص جدید را بر اساس رویکرد احتمالی بصری پیشنهاد می کنیم که برای خوشه های همپوشانی قابل استفاده است. با توجه به اینکه اخیرا افزایش قابل توجهی در تجزیه و تحلیل داده ها با خوشه های به طور طبیعی همپوشانی وجود دارد، این شاخص جدید به درستی مقایسه الگوریتم های خوشه بندی را می دهد. پس از ارائه شاخص جدید، آزمایشات با مجموعه داده های مصنوعی و واقعی نشان داده شده و تجزیه و تحلیل می شود. نتایج بیش از یک شبکه اجتماعی واقعی نیز ارائه و مورد بحث قرار گرفته است. نتایج نشان می دهد که شاخص جدید می تواند به طور صحیح شباهت بین دو پارتیشن مجموعه داده را اندازه گیری کند، در حالی که سطوح مختلف همپوشانی در خوشه های تجزیه و تحلیل شده وجود دارد.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
External validation indexes allow similarities between two clustering solutions to be quantified. With classical external indexes, it is possible to quantify how similar two disjoint clustering solutions are, where each object can only belong to a single cluster. However, in practical applications, it is common for an object to have more than one label, thereby belonging to overlapped clusters; for example, subjects that belong to multiple communities in social networks. In this study, we propose a new index based on an intuitive probabilistic approach that is applicable to overlapped clusters. Given that recently there has been a remarkable increase in the analysis of data with naturally overlapped clusters, this new index allows to comparing clustering algorithms correctly. After presenting the new index, experiments with artificial and real datasets are shown and analyzed. Results over a real social network are also presented and discussed. The results indicate that the new index can correctly measure the similarity between two partitions of the dataset when there are different levels of overlap in the analyzed clusters.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Expert Systems with Applications - Volume 64, 1 December 2016, Pages 549-556
نویسندگان
, , ,