کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
10349616 863691 2011 15 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
How to obtain efficient GPU kernels: An illustration using FMM & FGT algorithms
موضوعات مرتبط
مهندسی و علوم پایه شیمی شیمی تئوریک و عملی
پیش نمایش صفحه اول مقاله
How to obtain efficient GPU kernels: An illustration using FMM & FGT algorithms
چکیده انگلیسی
► Algorithmic redesign is applied to fast summation kernels aiming for performance on GPUs. ► Performance improvements achieve close to practical peak, at over 500 Gop/s on Nvidia Tesla C1060. ► Design strategies demonstrated: thread branching avoidance, multithreading occupancy, memory management, loop optimizations.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Computer Physics Communications - Volume 182, Issue 10, October 2011, Pages 2084-2098
نویسندگان
, , ,