کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
431633 688598 2015 6 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Bottom-k document retrieval
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نظریه محاسباتی و ریاضیات
پیش نمایش صفحه اول مقاله
Bottom-k document retrieval
چکیده انگلیسی

We consider the problem of retrieving the k documents from a collection of strings where a given pattern P appears least   often. This has potential applications in data mining, bioinformatics, security, and big data. We show that adapting the classical linear-space solutions for this problem is trivial, but the compressed-space solutions are not easy to extend. We design a new solution for this problem that matches the best-known result when using 2|CSA|+o(n)2|CSA|+o(n) bits, where CSACSA is a Compressed Suffix Array. Our structure answers queries in the time needed by the CSACSA to find the suffix array interval of the pattern plus O(klg⁡klgϵ⁡n)O(klg⁡klgϵ⁡n) accesses to suffix array cells, for any constant ϵ>0ϵ>0.

ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Journal of Discrete Algorithms - Volume 32, May 2015, Pages 69–74
نویسندگان
, ,