کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6874985 1441466 2018 30 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
A course on big data analytics
ترجمه فارسی عنوان
دوره ای در تجزیه و تحلیل داده های بزرگ
کلمات کلیدی
برنامه تحصیلی، تحصیلات کارشناسی اطلاعات بزرگ، پردازش ابری،
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نظریه محاسباتی و ریاضیات
چکیده انگلیسی
This report details a course on big data analytics designed for undergraduate junior and senior computer science students. The course is heavily focused on projects and writing code for big data processing. It is designed to help students learn parallel and distributed computing frameworks and techniques commonly used in industry. The curriculum includes a progression of projects requiring increasingly sophisticated big data processing ranging from data preprocessing with Linux tools, distributed processing with Hadoop MapReduce and Spark, and database queries with Hive and Google's BigQuery. We discuss hardware infrastructure and experimentally evaluate the cost/benefit of an on-premise server versus Amazon's Elastic MapReduce. Finally, we showcase outcomes of our course in terms of student engagement and anonymous student feedback.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Journal of Parallel and Distributed Computing - Volume 118, Part 1, August 2018, Pages 166-176
نویسندگان
,