کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4949072 1439960 2017 8 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Cardinality Estimation Meets Good-Turing
ترجمه فارسی عنوان
برآورد شایستگی ملاقات خوب تورینگ
ترجمه چکیده
الگوریتم های برآورد کاردینال یک جریان از عناصر را دریافت می کنند که ممکن است دستور آن دلخواه باشد، با تکرارهای احتمالی، و تعدادی از عناصر متمایز را بازگرداند. چنین الگوریتمهای معمولا به دنبال به حداقل رساندن ذخیره و پردازش مورد نیاز در قیمت اشتباه در خروجی خود هستند. برنامه های واقعی دنیای این الگوریتم ها برای پردازش حجم زیادی داده های نظارت شده لازم است، و برای جمع آوری و تجزیه و تحلیل کل جریان ورودی غیر عملی است. در چنین مواردی، معمولا نمونه گیری و پردازش تنها یک قسمت کوچک از عناصر جریان است. در این مقاله یک الگوریتم عمومی برای ترکیب هر الگوریتم برآورد قدرتمند با یک فرایند نمونه برداری ارائه و تحلیل می شود. ما نشان می دهیم که الگوریتم نمونه گیری پیشنهادی بر روی عدم تساوی آستانه بندی برآوردگر تأثیر نمی گذارد و اثر نمونه گیری بر روی واریانس برآوردگر را تحلیل می کنیم.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نظریه محاسباتی و ریاضیات
چکیده انگلیسی
Cardinality estimation algorithms receive a stream of elements whose order might be arbitrary, with possible repetitions, and return the number of distinct elements. Such algorithms usually seek to minimize the required storage and processing at the price of inaccuracy in their output. Real-world applications of these algorithms are required to process large volumes of monitored data, making it impractical to collect and analyze the entire input stream. In such cases, it is common practice to sample and process only a small part of the stream elements. This paper presents and analyzes a generic algorithm for combining every cardinality estimation algorithm with a sampling process. We show that the proposed sampling algorithm does not affect the estimator's asymptotic unbiasedness, and we analyze the sampling effect on the estimator's variance.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Big Data Research - Volume 9, September 2017, Pages 1-8
نویسندگان
, , ,