Aug, 2024

重用视觉变换器的注意力以实现高效的Xbar计算

TL;DR本研究针对现有视觉变换器(ViT)在内存计算(IMC)实现中的能耗和效率问题,提出了TReX框架,通过高效重用注意力机制优化ViT模型,从而实现最佳的准确性、能耗、延迟和面积(EDAP)权衡。研究发现,TReX在仅约1%的准确率下降的情况下,能够在DeiT-S和LV-ViT-S模型中分别实现2.3倍和2.19倍的EDAP减少,并在自然语言处理任务中表现出色。