کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
391947 664571 2015 20 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Recovering the number of clusters in data sets with noise features using feature rescaling factors
ترجمه فارسی عنوان
بازیابی تعدادی از خوشه ها در مجموعه داده ها با ویژگی های نویز با استفاده از عوامل بازنشستگی ویژگی
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی

In this paper we introduce three methods for re-scaling data sets aiming at improving the likelihood of clustering validity indexes to return the true number of spherical Gaussian clusters with additional noise features. Our method obtains feature re-scaling factors taking into account the structure of a given data set and the intuitive idea that different features may have different degrees of relevance at different clusters.We experiment with the Silhouette (using squared Euclidean, Manhattan, and the pth power of the Minkowski distance), Dunn’s, Calinski–Harabasz and Hartigan indexes on data sets with spherical Gaussian clusters with and without noise features. We conclude that our methods indeed increase the chances of estimating the true number of clusters in a data set.

ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Sciences - Volume 324, 10 December 2015, Pages 126–145
نویسندگان
, ,