کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6862668 677013 2014 18 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Efficient frequent itemset mining methods over time-sensitive streams
ترجمه فارسی عنوان
روش های مؤثر در استخراج اقلام در جریان های حساس به زمان
کلمات کلیدی
جریان، اقلام مکرر، داده کاوی، قوانین انجمن، حساس به زمان،
ترجمه چکیده
داده های جریان داده به طور پویا و به سرعت در حال رسیدن هستند، و ویژگی ها را نمی توان با استفاده از پنجره کشویی مبتنی بر معامله نشان داد؛ بنابراین، نتایج معدن نادرست است. این مقاله بر روی این مسئله تمرکز دارد و یک پنجره پنجره کشویی مبتنی بر نشانه را ایجاد می کند که می تواند بیشتر به یک پنجره کشویی بر مبنای معامله تبدیل شود. بر اساس این مدل، یک درخت شمارش گسترده برای توسعه اطلاعات ضروری نگهداری می شود. در الگوریتم معدن مکرر مورد استفاده ما، ما نوع تغییر تبدیل را به صورت پویا طبقه بندی اقلام را به دسته بندی معرفی می کنیم؛ بنابراین، پردازش برخی از اقلام خاص می تواند به تعویق افتد یا نادیده گرفته شود، به این معناست که اقلام مورد استفاده قرار نمی گیرد مگر اینکه مرزهای نوع تغییر آن به آستانه برسند. به عنوان یک نتیجه، هرس محاسباتی می تواند انجام شود. با این وجود، تنها شرایط برای دستیابی به نتایج دقیق را تضمین می کند و بنابراین نمی تواند بهترین عملکرد را به دست آورد. این مشکل در الگوریتم تقریبی معدن ما بهبود یافته است، که در آن ما یک استراتژی مبتنی بر قاعده اکتشافی پیشنهاد می کنیم. علاوه بر این، می تواند هزینه های محاسباتی بیشتری را با خطای معدن قابل تحمل صرفه جویی کند. تجزیه و تحلیل تئوری و مطالعات تجربی نشان می دهد که الگوریتم های پیشنهادی ما با دقت بالا، صرف زمان و حافظه کمتر محاسبه می کنند و از روش اولیه و الگوریتم های پیشرفته بالاتر بهره مند می شوند.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Stream data arrives dynamically and rapidly, and the characteristics cannot be reflected by the traditional transaction-based sliding window; thus, the mining results are inaccurate. This paper focuses on this problem and constructs a timestamp-based sliding window model, which can be further converted into a transaction-based sliding window. Based on this model, an extended enumeration tree is developed to incrementally maintain the essential information. In our proposed frequent itemset mining algorithm, we introduce the type transforming bound to dynamically classify the itemsets into categories; thus, certain itemset processing can be deferred or ignored, that is, an itemset will not be handled unless its type transforming bounds reach a threshold; as a result, the computational pruning can be conducted. Nevertheless, it only guarantees the conditions to obtain accurate results, and thus cannot achieve the best performance. This problem is further improved in our approximate mining algorithm, in which we propose a heuristic rule-based strategy. Additionally, it can save more computational cost with a tolerable mining error. Theoretical analysis and experimental studies demonstrate that our proposed algorithms have high accuracy, spend less computational time and memory, and significantly outperform the baseline method and state-of-the-art algorithms.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Knowledge-Based Systems - Volume 56, January 2014, Pages 281-298
نویسندگان
, , , , ,