کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
391488 661792 2016 13 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Density-based geodesic distance for identifying the noisy and nonlinear clusters
ترجمه فارسی عنوان
فاصله جغرافیایی مبتنی بر تراکم برای شناسایی خوشه های پر سر و صدا و غیر خطی
کلمات کلیدی
فاصله زمینشناسی، ضریب چگالی مبتنی بر محور متقابل، خوشه بندی داده های پر سر و صدا، غیر خطی،
ترجمه چکیده
تجزیه و تحلیل خوشه ای می تواند استخراج الگوهای ضمنی در یک مجموعه داده ها را آسان کند و گروه بندی طبیعی خود را بدون نیاز به اطلاعات طبقه بندی قبلی ایجاد کند. برای نتایج تجزیه و تحلیل خوشه ای برتر، تعدادی از اقدامات فاصله ای پیشنهاد شده است. به تازگی، فاصله ژئودزی به طور گسترده ای برای الگوریتم های خوشه بندی برای گروه بندی های غیر خطی مورد استفاده قرار گرفته است. با این حال، فاصله جغرافیایی به سر و صدای حساس است و از این رو، خوشه بندی مبتنی بر فاصله ژئودزی ممکن است نتواند خوشه های غیرخطی را در ناحیه نویز کشف کند. در این مطالعه، ما یک فاصله جغرافیایی مبتنی بر تراکم را پیشنهاد می دهیم که می تواند خوشه ها را در شرایط غیرخطی و پر سر و صدا تشخیص دهد. آزمایشات روی مجموعه داده های شبیه سازی و معیارهای مختلف برای بررسی خواص جغرافیایی پیشنهادی و مقایسه عملکرد آن با اندازه گیری های فاصله موجود انجام شده است. نتایج تجربی تایید می کند که یک الگوریتم خوشه بندی با اندازه گیری فاصله پیشنهاد شده عملکرد برتر نسبت به رقبا را نشان می دهد؛ این خصوصا زمانی بود که ساختار خوشه ای در داده ها ذاتا پر سر و صدا و الگوهای غیر خطی بود.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Clustering analysis can facilitate the extraction of implicit patterns in a dataset and elicit its natural groupings without requiring prior classification information. For superior clustering analysis results, a number of distance measures have been proposed. Recently, geodesic distance has been widely applied to clustering algorithms for nonlinear groupings. However, geodesic distance is sensitive to noise and hence, geodesic distance-based clustering may fail to discover nonlinear clusters in the region of the noise. In this study, we propose a density-based geodesic distance that can identify clusters in nonlinear and noisy situations. Experiments on various simulation and benchmark datasets are conducted to examine the properties of the proposed geodesic distance and to compare its performance with that of existing distance measures. The experimental results confirm that a clustering algorithm with the proposed distance measure demonstrated superior performance compared to the competitors; this was especially true when the cluster structures in the data were inherently noisy and nonlinearly patterned.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Sciences - Volume 360, 10 September 2016, Pages 231-243
نویسندگان
, ,