کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
8941786 1645031 2018 26 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Clustering based on grid and local density with priority-based expansion for multi-density data
ترجمه فارسی عنوان
خوشه بندی بر اساس چگالی شبکه و محلی با گسترش اولویت برای داده های چند ترافیک
کلمات کلیدی
خوشه بندی داده ها، رتبه بندی شبکه چگالی محلی، شبکه تغییر تنظیم شده، گسترش توسط اولویت، نادیده گرفتن،
ترجمه چکیده
خوشه بندی بر اساس شبکه و تراکم برای مجموعه داده های چند تراکمی نقش مهمی در کاوش داده ها دارد. در این کار، یک روش خوشه بندی که شامل یک استراتژی رتبه بندی شبکه ای بر اساس چگالی محلی و گسترش لنگر مبتنی بر اولویت است، پیشنهاد شده است. در روش پیشنهادی، سلول های شبکه به ترتیب با توجه به خواص شبکه محلی رتبه بندی می شوند بنابراین مجموعه داده به یک شبکه رتبه بندی تبدیل می شود. سپس یک شبکه تغییر تنظیم شده برای محاسبه تراکم سلول شبکه معرفی می شود. یک استراتژی توسعه سلولی که شبیه سازی رشد کلنی باکتریایی است، برای بهبود کامل بودن هر خوشه استفاده می شود. در نهایت یک روش سازگار برای رسیدگی به سلول های پر سر و صدا برای اطمینان از خوشه بندی دقیق مورد استفاده قرار می گیرد. دقت، حساسیت پارامترها و هزینه محاسبه الگوریتم پیشنهادی مورد تجزیه و تحلیل قرار گرفته است. سپس عملکرد الگوریتم پیشنهادی با سایر روش های خوشه بندی با استفاده از چهار مجموعه داده دو بعدی مقایسه می شود و کاربرد روش پیشنهادی در مجموعه داده های بزرگ بعدی، مورد بحث قرار می گیرد. نتایج تجربی نشان می دهد که الگوریتم پیشنهادی عملکرد خوب را از لحاظ دقت، توانایی حذف، استحکام (حساسیت پارامتر) و کارایی محاسباتی نشان می دهد. علاوه بر این، نتایج نشان می دهد که الگوریتم پیشنهادی می تواند به طور موثر مساله خوشه بندی چند چگالی برخورد کند.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Clustering based on grid and density for multi-density datasets plays a key role in data mining. In this work, a clustering method that consists of a grid ranking strategy based on local density and priority-based anchor expansion is proposed. In the proposed method, grid cells are ranked first according to local grid properties so the dataset is transformed into a ranked grid. An adjusted shifting grid is then introduced to calculate grid cell density. A cell expansion strategy that simulates the growth of bacterial colony is used to improve the completeness of each cluster. An adaptive technique is finally adopted to handle noisy cells to ensure accurate clustering. The accuracy, parameter sensitivity and computation cost of the proposed algorithm are analysed. The performance of the proposed algorithm is then compared to other clustering methods using four two-dimensional datasets, and the applicability of the proposed method to high-dimensional, large-scale dataset is discussed. Experimental results demonstrate that the proposed algorithm shows good performance in terms of accuracy, de-noising capability, robustness (parameters sensitivity) and computational efficiency. In addition, the results show that the proposed algorithm can handle effectively the problem of multi-density clustering.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Sciences - Volume 468, November 2018, Pages 103-116
نویسندگان
, , , , , ,