کد مقاله | کد نشریه | سال انتشار | مقاله انگلیسی | نسخه تمام متن |
---|---|---|---|---|
6862196 | 677221 | 2016 | 13 صفحه PDF | دانلود رایگان |
عنوان انگلیسی مقاله ISI
Instance selection of linear complexity for big data
ترجمه فارسی عنوان
انتخاب نمونه از پیچیدگی خطی برای داده های بزرگ
دانلود مقاله + سفارش ترجمه
دانلود مقاله ISI انگلیسی
رایگان برای ایرانیان
کلمات کلیدی
نزدیکترین همسایه، کاهش اطلاعات، انتخاب نمونه، هش اطلاعات بزرگ،
موضوعات مرتبط
مهندسی و علوم پایه
مهندسی کامپیوتر
هوش مصنوعی
چکیده انگلیسی
In this paper, two new algorithms with linear complexity for instance selection purposes are presented. Both algorithms use locality-sensitive hashing to find similarities between instances. While the complexity of conventional methods (usually quadratic, O(n2), or log-linear, O(nlogn)) means that they are unable to process large-sized data sets, the new proposal shows competitive results in terms of accuracy. Even more remarkably, it shortens execution time, as the proposal manages to reduce complexity and make it linear with respect to the data set size. The new proposal has been compared with some of the best known instance selection methods for testing and has also been evaluated on large data sets (up to a million instances).
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Knowledge-Based Systems - Volume 107, 1 September 2016, Pages 83-95
Journal: Knowledge-Based Systems - Volume 107, 1 September 2016, Pages 83-95
نویسندگان
Álvar Arnaiz-González, José-Francisco DÃez-Pastor, Juan J. RodrÃguez, César GarcÃa-Osorio,