کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
4948577 | 1439616 | 2016 | 10 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
Probability model selection and parameter evolutionary estimation for clustering imbalanced data without sampling
ترجمه فارسی عنوان
انتخاب مدل احتمال و ارزیابی تکاملی پارامتر برای خوشه بندی داده های عدم توازن بدون نمونه برداری
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
داده های نامتعادل، داده کاوی، خوشه بندی انتخاب مدل،
ترجمه چکیده
مشکلات عدم تعادل اطلاعات ناشی از جمع آوری داده ها، به ویژه از داده های بزرگ، در سال های اخیر تبدیل به یک مسئله چالش برانگیز شده است. در داده های نامتقارن، این مجموعه داده های جزئی احتمالا الگوهای بسیار مهمی را نشان می دهد. اگرچه برخی روش ها برای کشف الگوهای کلاس وجود دارد، اما مسئله در حال ظهور این است که تعداد اندکی از آنها به الگوهای جزئی خوشه اعمال شده اند. به طور معمول، نمونه های جزئی در داده های بزرگ غرق می شوند و غالبا نادیده گرفته می شوند و به الگوهای اصلی تقسیم می شوند بدون نظارت بر مجموعه آموزشی. از آنجا که خوشه بندی اقلیت ها یک فرآیند نامشخص است، در این مقاله، ما انتخاب مدل و محاسبات تکاملی را برای حل عدم قطعیت و پنهان کردن اطلاعات جزئی در خوشه بندی داده های نامتقارن استفاده می شود. با توجه به مجموعه داده ها، انتخاب مدل انتخاب یک مدل از مجموعه ای از مدل های نامزد است. ما مدل های احتمالی را به عنوان مدل های نامزد انتخاب می کنیم زیرا می توانند به طور موثر حل ناامنی و در نتیجه مناسب برای عدم تعادل داده ها باشند. با توجه به دشواری برآورد پارامترهای مدل، از فرآیند تکاملی برای تنظیم و ارزیابی پارامترهای بهینه استفاده می کنیم. نتایج تجربی نشان می دهد که رویکرد پیشنهادی ما برای خوشه بندی داده های نامتعادل دارای توانایی جستجو و کشف الگوهای جزئی است و همچنین می تواند عملکرد بهترتری را نسبت به بسیاری دیگر از الگوریتم های خوشه بندی مرتبط در چندین شاخص عملکرد ارائه دهد.
موضوعات مرتبط
مهندسی و علوم پایه
مهندسی کامپیوتر
هوش مصنوعی
چکیده انگلیسی
Data imbalance problems arisen from the accumulated amount of data, especially from big data, have become a challenging issue in recent years. In imbalanced data, those minor data sets probably imply much important patterns. Although there are some approaches for discovering class patterns, an emerging issue is that few of them have been applied to cluster minor patterns. In common, the minor samples are submerged in big data, and they are often ignored and misclassified into major patterns without supervision of training set. Since clustering minorities is an uncertain process, in this paper, we employ model selection and evolutionary computation to solve the uncertainty and concealment of the minor data in imbalanced data clustering. Given data set, model selection is to select a model from a set of candidate models. We select probability models as candidate models because they can solve uncertainty effectively and thereby are well-suited to data imbalance. Considering the difficulty of estimating the models' parameters, we employ evolutionary process to adjust and estimate the optimal parameters. Experimental results show that our proposed approach for clustering imbalanced data has the ability of searching and discovering minor patterns, and can also obtain better performances than many other relevant clustering algorithms in several performance indices.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Neurocomputing - Volume 211, 26 October 2016, Pages 172-181
Journal: Neurocomputing - Volume 211, 26 October 2016, Pages 172-181
نویسندگان
Jiancong Fan, Zhonghan Niu, Yongquan Liang, Zhongying Zhao,