کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6853915 1437279 2018 15 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Sampling strategies for extracting information from large data sets
ترجمه فارسی عنوان
استراتژی های نمونه گیری برای استخراج اطلاعات از مجموعه داده های بزرگ
کلمات کلیدی
الگوریتم های نمونه برداری، پیچیدگی فضا، پیچیدگی زمان، تنظیم عملیات، قدرتمند بودن داده ها، بهینه سازی زمان،
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر هوش مصنوعی
چکیده انگلیسی
Getting information from large volumes of data is very expensive in terms of resources like CPU and memory, as well as computation time. The analysis of a small data set extracted from the original set is preferred. From this small set, called sample, approximate results can be obtained. The errors are acceptable given the reduced cost necessary for processing the data. Using sampling algorithms with small errors saves execution time and resources. This paper presents comparisons between sampling algorithms in order to determine which one performs better when taking into account set operations such as intersect, union and difference. The comparison focuses on the errors introduced by each algorithm for different sample sizes and on execution times.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Data & Knowledge Engineering - Volume 115, May 2018, Pages 1-15
نویسندگان
, , , ,