Communication Optimization of Iterative Sparse Matrix-Vector Multiply on GPUs and FPGAs
Trading communication with redundant computation can increase the silicon efficiency of FPGAs and GPUs in accelerating communication-bound sparse iterative solvers. While k iterations of the iterative solver can be unrolled to provide O(k) reduction in communication cost, the extent of this unrollin...
محفوظ في:
المؤلفون الرئيسيون: | , , |
---|---|
مؤلفون آخرون: | |
التنسيق: | مقال |
اللغة: | English |
منشور في: |
2015
|
الموضوعات: | |
الوصول للمادة أونلاين: | https://hdl.handle.net/10356/81168 http://hdl.handle.net/10220/39128 |
الوسوم: |
إضافة وسم
لا توجد وسوم, كن أول من يضع وسما على هذه التسجيلة!
|
المؤسسة: | Nanyang Technological University |
اللغة: | English |
كن أول من يترك تعليقا!