کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4951780 1441603 2017 12 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Parallel set similarity join on big data based on Locality-Sensitive Hashing
ترجمه فارسی عنوان
شباهت به طور موازی تنظیم شده بر روی داده های بزرگ براساس حسابی حساس به محل قرار می گیرد
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نظریه محاسباتی و ریاضیات
چکیده انگلیسی
In this paper, a parallel set similarity join method is introduced using the MapReduce programming model. The proposed method uses Locality Sensitive Hashing (LSH) techniques to decrease the number of required comparisons for calculating the similarity of the sets. The performance of the proposed method has been compared with the best previous similarity join methods on real and synthetic datasets in terms of time. The experimental results show that the proposed method works faster than the former methods.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Science of Computer Programming - Volume 145, 1 October 2017, Pages 1-12
نویسندگان
, ,