کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
486771 703395 2010 10 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Fast recursive matrix multiplication for multi-core architectures
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر علوم کامپیوتر (عمومی)
پیش نمایش صفحه اول مقاله
Fast recursive matrix multiplication for multi-core architectures
چکیده انگلیسی

In this article, we present a fast algorithm for matrix multiplication optimized for recent multicore architectures. The implementation exploits different methodologies from parallel programming, like recursive decomposition, efficient low-level implementations of basic blocks, software prefetching, and task scheduling resulting in a multilevel algorithm with adaptive features. Measurements on different systems and comparisons with GotoBLAS, Intel Math Kernel Library (IMKL), and AMD Core Math Library (AMCL) show that the matrix implementation presented has a very high efficiency.

ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Procedia Computer Science - Volume 1, Issue 1, May 2010, Pages 67-76