کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4945144 1438298 2017 26 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Skewed distributions in semi-stream joins: How much can caching help?
ترجمه فارسی عنوان
توزیع های پیچ خورده در نیمه جریان می آیند: چقدر می تواند به کمک کند؟
کلمات کلیدی
پردازش نیمه جریان، پیوستن، حافظه جلوی مرحله، بهینه سازی عملکرد،
ترجمه چکیده
ما دو تکنیک بهینه سازی ارائه می دهیم: (1) یک روش ذخیره سازی برای داده های اصلی که اغلب استفاده می شود و (2) یک تکنیک برای تخلیه بار انتخابی از جریان های جریان. روش ذخیره سازی دقیق است و در سطح مقطع کار می کند. علاوه بر این، به معنای عمومی است که می توان آن را به الگوریتم های مختلف پیوستگی نیمه جریان برای مقابله با خرابی داده ها اعمال کرد. ما آن را با ترکیب آن با چندین شناخته شده نیمه جریان پیوند آن تجزیه و تحلیل، و نشان می دهد که آن را بهبود می بخشد نرخ خدمات بیش از 40٪ برای داده های معمول با توزیع های تقسیم شده است. روش تخلیه بار، بخش کوچکی از جریان است که برای پیوستن گرانتر است. در مقایسه با رویکردهای موجود، نرخ خدمات تحت تخلیه بار بهبود می یابد. داده های تجربی را نشان می دهد که نشان دهنده بهبود قابل ملاحظه ای نسبت به روابط مرتبط است و تجزیه و تحلیل حساسیت را برای پارامترهای مختلف داخلی انجام می دهند.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
We propose two such optimization techniques: (1) a caching technique for frequently used master data and (2) a technique for selective load shedding of stream tuples. The caching technique is fine-grained, operating on a tuple-level. Furthermore, it is generic in the sense that it can be applied to different semi-stream join algorithms to deal with data skew. We analyze it by combining it with various well-known semi-stream joins, and show that it improves the service rate by more than 40% for typical data with skewed distributions. The load shedding technique sheds the fraction of the stream that is most expensive to join. In contrast to existing approaches, the service rate improves under load shedding. We present experimental data showing significant improvements as compared to related approaches and perform a sensitivity analysis for various internal parameters.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Information Systems - Volume 64, March 2017, Pages 63-74
نویسندگان
, , , ,