کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
4951305 1441209 2017 32 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Grammar compressed sequences with rank/select support
ترجمه فارسی عنوان
ترتیب فشرده دستور زبان با پشتیبانی رتبه / انتخاب
کلمات کلیدی
فشرده سازی دستور زبان، توالی تکراری، نمایه سازی متن،
ترجمه چکیده
نمایندگی های توالی که نه تنها دسترسی مستقیم به نمادهای خود را دارند، بلکه همچنین عملیات رتبه بندی / انتخاب را، یک ساختار بنیادی اساسی در بسیاری از ساختارهای داده فشرده می باشند. چندین برنامه اخیر نیازمند نشان دادن توالی بسیار تکراری هستند و فشرده سازی آماری کلاسیک بی اثر است. ما به جای آن، معرفهای مبتنی بر گرامر برای توالی های تکراری معرفی می کنیم که تا 6 درصد از فضای مورد نیاز نماینده های آماری فشرده و پشتیبانی از دسترسی مستقیم و رتبه بندی / انتخاب عملیات در ده ثانیه می باشد. ما اثرات ساختارهای ما در برنامه های نمایه سازی متن را نشان می دهیم.
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نظریه محاسباتی و ریاضیات
چکیده انگلیسی
Sequence representations supporting not only direct access to their symbols, but also rank/select operations, are a fundamental building block in many compressed data structures. Several recent applications need to represent highly repetitive sequences, and classical statistical compression proves ineffective. We introduce, instead, grammar-based representations for repetitive sequences, which use up to 6% of the space needed by statistically compressed representations, and support direct access and rank/select operations within tens of microseconds. We demonstrate the impact of our structures in text indexing applications.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Journal of Discrete Algorithms - Volume 43, March 2017, Pages 54-71
نویسندگان
, , ,