Jun, 2024

ReduceFormer:通过求和进行张量缩减的注意力

TL;DRTransformers 的计算机视觉任务中,通过使用简化架构和改进的推理性能的 ReduceFormer 模型系列,有效地解决了传统 Transformer 模型中的计算问题,降低了延迟和提高了吞吐量,适用于计算资源和内存带宽有限的边缘设备以及追求高吞吐量的云计算。