Oct, 2023

BTR: 用于高效检索的二进制标记表示增强语言模型

TL;DR使用二进制标记表示,结合离线和运行时压缩,减少计算量和存储占用,在保持任务性能超过 95% 的同时,加速了最先进的推理速度达到 4 倍,并减少了 100 倍的存储空间。