Communication Optimization of Iterative Sparse Matrix-Vector Multiply on GPUs and FPGAs

Trading communication with redundant computation can increase the silicon efficiency of FPGAs and GPUs in accelerating communication-bound sparse iterative solvers. While k iterations of the iterative solver can be unrolled to provide O(k) reduction in communication cost, the extent of this unrollin...

وصف كامل

محفوظ في:
التفاصيل البيبلوغرافية
المؤلفون الرئيسيون: Rafique, Abid, Constantinides, George A., Kapre, Nachiket
مؤلفون آخرون: School of Computer Engineering
التنسيق: مقال
اللغة:English
منشور في: 2015
الموضوعات:
الوصول للمادة أونلاين:https://hdl.handle.net/10356/81168
http://hdl.handle.net/10220/39128
الوسوم: إضافة وسم
لا توجد وسوم, كن أول من يضع وسما على هذه التسجيلة!
المؤسسة: Nanyang Technological University
اللغة: English