Apr, 2024

CATP: 跨注意力令牌修剪以保留准确的多模态模型推理

TL;DR使用跨注意力层和精确投票策略,Cross-Attention Token Pruning(CATP)方法在多模态模型中提取有价值信息来确定重要性,相对于其他方法能达到 12.1 倍的准确率提升,并解决了计算效率和模型精度之间的权衡。