کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
486677 703390 2012 10 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Effective Implementation of DGEMM on Modern Multicore CPU
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر علوم کامپیوتر (عمومی)
پیش نمایش صفحه اول مقاله
Effective Implementation of DGEMM on Modern Multicore CPU
چکیده انگلیسی

In this paper we will present a detailed study on tuning double-precision matrix-matrix multiplication (DGEMM) on the Intel Xeon E5-2680 CPU. We selected an optimal algorithm from the instruction set perspective as well software tools optimized for Intel Advance Vector Extensions (AVX). Our optimizations included the use of vector memory operations, and AVX instructions. Our proposed algorithm achieves a performance improvement of 33% compared to the latest results achieved using the Intel Math Kernel Library DGEMM subroutine.

ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Procedia Computer Science - Volume 9, 2012, Pages 126-135