کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
11002412 1440623 2019 21 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Optimizing distributed data stream processing by tracing
ترجمه فارسی عنوان
بهینه سازی پردازش جریان داده توزیع شده با ردیابی
کلمات کلیدی
پردازش داده توزیع شده، پردازش داده ها، ردیابی توزیع، منبع پرونده، آپاچی جرقه،
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نظریه محاسباتی و ریاضیات
چکیده انگلیسی
By using Apache Spark as illustration, we show how various data stream processing efficiency issues can be mitigated or optimized by our distributed tracing engine. We describe and qualitatively compare two different designs, one based on reporting to a distributed database and another based on trace piggybacking. Our prototype implementation consists of wrappers suitable for JVM environments in general, with minimal impact on the source code of the core system. Our tracing framework is the first to solve tracing in multiple systems across boundaries and to provide detailed performance measurements suitable for automated optimization, not just debugging.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Future Generation Computer Systems - Volume 90, January 2019, Pages 578-591
نویسندگان
, , , ,