کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4950489 1440646 2017 47 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
A new efficient approach for mining uncertain frequent patterns using minimum data structure without false positives
ترجمه فارسی عنوان
رویکرد کارآمد جدید برای معادن الگوهای مکرر نامطلوب با استفاده از حداقل ساختار داده ها بدون مثبت کاذب
کلمات کلیدی
صحت، داده کاوی، احتمال احتمالی، معدن الگوی مکرر، الگو نامشخص،
ترجمه چکیده
به تازگی پیشنهاد مفهوم معدن الگوی نامشخص برای پاسخگویی به تقاضا برای پردازش پایگاه داده ها با داده های نامشخص ارائه شده است و روش های متفاوتی در این زمینه مورد استفاده قرار گرفته است. با این حال، روش های قبلی دارای محدودیت های زیر است. روش های مدرن مبتنی بر ساختار درختی می توانند مشکلات مربوط به مرگ و میر را از لحاظ زمانبندی و استفاده از حافظه با توجه به ویژگی های پایگاه داده های نامشخص و تنظیمات آستانه ای ایجاد کنند، زیرا ساختار داده های درخت خود می تواند در فرایندهای معدن خود بیش از حد بزرگ و پیچیده باشد. به منظور غلبه بر چنین مشکلی، روشهای مختلف تقریبی پیشنهاد شده است. با این حال، آنها روش هایی هستند که عملکرد معادن خود را با هزینه دقت نتایج معادن افزایش می دهند. برای حل مشکلات، ما یک الگوریتم دقیق و کارآمد برای معادن الگوهای مکرر نامطلوب بر اساس ساختارهای داده جدید و تکنیک های استخراج معادن پیشنهاد می کنیم که همچنین می تواند صحت نتایج معدن را بدون هیچگونه اثبات کاذب تضمین کند. ساختارهای اطلاعات مبتنی بر لیست تازه ارائه شده و تکنیک های برش اجازه می دهد مجموعه ای کامل از الگوهای مکرر نامشخص به طور موثر بدون تلفات الگو مورد بهره برداری قرار گیرد. ما همچنین نشان می دهیم که الگوریتم پیشنهادی از جنبه های گذشته هنر گذشته در ابعاد نظری و تجربی برتر است. به خصوص، ما نتایج تحلیلی ارزیابی عملکرد برای انواع مختلف داده ها ارائه می دهیم تا کارایی زمان اجرا، استفاده از حافظه و مقیاس پذیری را در روش ما نشان دهیم.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نظریه محاسباتی و ریاضیات
چکیده انگلیسی
The concept of uncertain pattern mining was recently proposed to fulfill the demand for processing databases with uncertain data, and various relevant methods have been devised. However, previous approaches have the following limitations. State-of-the-art methods based on tree structure can cause fatal problems in terms of runtime and memory usage according to the characteristics of uncertain databases and threshold settings because their own tree data structures can become excessively large and complicated in their mining processes. Various approximation approaches have been suggested in order to overcome such problems; however, they are methods that increase their own mining performance at the cost of accuracy of the mining results. In order to solve the problems, we propose an exact, efficient algorithm for mining uncertain frequent patterns based on novel data structures and mining techniques, which can also guarantee the correctness of the mining results without any false positives. The newly proposed list-based data structures and pruning techniques allow a complete set of uncertain frequent patterns to be mined more efficiently without pattern losses. We also demonstrate that the proposed algorithm outperforms previous state-of-the art approaches in both theoretical and empirical aspects. Especially, we provide analytical results of performance evaluation for various types of datasets to show efficiency of runtime, memory usage, and scalability in our method.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Future Generation Computer Systems - Volume 68, March 2017, Pages 89-110
نویسندگان
, ,