کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
416634 681389 2014 13 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
A non-parametric method to estimate the number of clusters
ترجمه فارسی عنوان
یک روش غیر پارامتری برای برآورد تعداد خوشه ها
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نظریه محاسباتی و ریاضیات
چکیده انگلیسی

An important and yet unsolved problem in unsupervised data clustering is how to determine the number of clusters. The proposed slope statistic is a non-parametric and data driven approach for estimating the number of clusters in a dataset. This technique uses the output of any clustering algorithm and identifies the maximum number of groups that breaks down the structure of the dataset. Intensive Monte Carlo simulation studies show that the slope statistic outperforms (for the considered examples) some popular methods that have been proposed in the literature. Applications in graph clustering, in iris and breast cancer datasets are shown.

ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computational Statistics & Data Analysis - Volume 73, May 2014, Pages 27–39
نویسندگان
, , ,