کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6858790 1438407 2018 32 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Local rough set: A solution to rough data analysis in big data
ترجمه فارسی عنوان
مجموعه خشن محلی: راه حل برای تجزیه و تحلیل داده های خشن در داده های بزرگ
کلمات کلیدی
نظریه مجموعه خشن، مجموعه خشن محلی تقریب مفهوم، کاهش مشخصه، داده های محدود با برچسب،
ترجمه چکیده
به عنوان یک روش یادگیری تحت نظارت، نظریه مجموعه کلاسیک خشن اغلب نیاز به مقدار زیادی از داده های برچسب دار، که در آن تقریب مفهوم و کاهش ویژگی دو موضوع کلیدی است. با این حال، با رسیدن به سن داده های بزرگ، اطلاعات نشانه گذاری یک کار گران قیمت و کارآمد است و گاهی حتی غیرقابل اجتناب است، در حالی که داده های بدون برچسب ذخیره و ارزان می شوند. از این رو، تکنیک های تجزیه و تحلیل داده های خشن در داده های بزرگ با استفاده از رویکرد نیمه نظارتی، با اطلاعات محدود شده با برچسب، مطلوب هستند. اگر چه بسیاری از الگوریتم های تقریبی مفهوم و الگوریتم کاهش ویژگی در نظریه مجموعه کلاسیک ارائه شده است، اغلب این روش ها قادر به کار در زمینه داده های بزرگ با اندازه محدود نیستند. چالش های تئوری مجموعه کلاسیک خشن می تواند با سه موضوع خلاصه شود: املاک با برچسب محدود با داده های بزرگ، ناکارآمدی محاسباتی و بیش از حد در کاهش ویژگی. برای مقابله با این سه چالش، یک چارچوب نظری را به نام مجموعه محلی خشن معرفی می کنیم و یک سری مفهوم تقریبی مفهوم و الگوریتم های کاهش ویژگی را با پیچیدگی زمان خطی می سازیم که می تواند به طور موثر و کارا در داده های محدود با برچسب بزرگ شده کار کند. تجزیه و تحلیل تئوری و نتایج تجربی نشان می دهد که هر یک از الگوریتم های مجموعه خشن محلی به طور قابل توجهی از همگرایی اصلی آن در نظریه مجموعه کلاسیک خشن تر است. شایان ذکر است که عملکرد الگوریتم در مجموعه خشن محلی در هنگام برخورد با مجموعه داده های بزرگ اهمیت بیشتری پیدا می کند.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
As a supervised learning method, classical rough set theory often requires a large amount of labeled data, in which concept approximation and attribute reduction are two key issues. With the advent of the age of big data however, labeling data is an expensive and laborious task and sometimes even infeasible, while unlabeled data are cheap and easy to collect. Hence, techniques for rough data analysis in big data using a semi-supervised approach, with limited labeled data, are desirable. Although many concept approximation and attribute reduction algorithms have been proposed in the classical rough set theory, quite often, these methods are unable to work well in the context of limited labeled big data. The challenges to classical rough set theory can be summarized with three issues: limited labeled property of big data, computational inefficiency and over-fitting in attribute reduction. To address these three challenges, we introduce a theoretic framework called local rough set, and develop a series of corresponding concept approximation and attribute reduction algorithms with linear time complexity, which can efficiently and effectively work in limited labeled big data. Theoretical analysis and experimental results show that each of the algorithms in the local rough set significantly outperforms its original counterpart in classical rough set theory. It is worth noting that the performances of the algorithms in the local rough set become more significant when dealing with larger data sets.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: International Journal of Approximate Reasoning - Volume 97, June 2018, Pages 38-63
نویسندگان
, , , , , , , , ,