کد مقاله کد نشریه سال انتشار مقاله انگلیسی نسخه تمام متن
6930467 867538 2016 16 صفحه PDF دانلود رایگان
عنوان انگلیسی مقاله ISI
Separable projection integrals for higher-order correlators of the cosmic microwave sky: Acceleration by factors exceeding 100
ترجمه فارسی عنوان
انتگرال پروژهای جداگانه برای همبستگی مرتبه بالاتر از آسمان مایکروویو کیهانی: شتاب توسط عوامل بیش از 100
موضوعات مرتبط
مهندسی و علوم پایه مهندسی کامپیوتر نرم افزارهای علوم کامپیوتر
چکیده انگلیسی
We demonstrate significant speed-ups of ≈100×, arising from a combination of algorithmic improvements and architecture-aware optimisations targeted at improving thread and vectorisation behaviour. The resulting MPI/OpenMP hybrid code is capable of executing on clusters containing processors and/or coprocessors, with strong-scaling efficiency of 98.6% on up to 16 nodes. We find that a single coprocessor outperforms two processor sockets by a factor of 1.3× and that running the same code across a combination of both microarchitectures improves performance-per-node by a factor of 3.38×. By making bispectrum calculations competitive with those for the power spectrum (or two-point correlator) we are now able to consider joint analysis for cosmological science exploitation of new data.
ناشر
Database: Elsevier - ScienceDirect (ساینس دایرکت)
Journal: Journal of Computational Physics - Volume 310, 1 April 2016, Pages 285-300
نویسندگان
, , , , ,