Crossbar-aligned & integer-only neural network compression for efficient in-memory acceleration
Crossbar-based In-Memory Computing (IMC) accelerators preload the entire Deep Neural Network (DNN) into crossbars before inference. However, devices with limited crossbars cannot infer increasingly complex models. IMC-pruning can reduce the usage of crossbars, but current methods need expensive extr...
محفوظ في:
المؤلفون الرئيسيون: | Huai, Shuo, Liu, Di, Luo, Xiangzhong, Chen, Hui, Liu, Weichen, Subramaniam, Ravi |
---|---|
مؤلفون آخرون: | School of Computer Science and Engineering |
التنسيق: | Conference or Workshop Item |
اللغة: | English |
منشور في: |
2023
|
الموضوعات: | |
الوصول للمادة أونلاين: | https://hdl.handle.net/10356/165352 |
الوسوم: |
إضافة وسم
لا توجد وسوم, كن أول من يضع وسما على هذه التسجيلة!
|
المؤسسة: | Nanyang Technological University |
اللغة: | English |
مواد مشابهة
-
CRIMP: compact & reliable DNN inference on in-memory processing via crossbar-aligned compression and non-ideality adaptation
بواسطة: Huai, Shuo, وآخرون
منشور في: (2023) -
A comprehensive study on optimization techniques for AMR robots recognition models
بواسطة: Zheng, Hao Peng
منشور في: (2025) -
You only search once: on lightweight differentiable architecture search for resource-constrained embedded platforms
بواسطة: Luo, Xiangzhong, وآخرون
منشور في: (2023) -
EdgeCompress: coupling multi-dimensional model compression and dynamic inference for EdgeAI
بواسطة: Kong, Hao, وآخرون
منشور في: (2023) -
Smart scissor: coupling spatial redundancy reduction and CNN compression for embedded hardware
بواسطة: Kong, Hao, وآخرون
منشور في: (2023)