Jun, 2022

句向量排序模型的极端压缩:在边缘设备上实现更快的推理、更长的电池续航和更少的存储

TL;DR本篇研究提出了在两种不同类型的ranker模型上扩展句子转换蒸馏过程的两种方法,包括生成最优尺寸的词汇表和在蒸馏之前对教师的嵌入维数进行降维。结果表明,采用这些扩展技术的学生模型具有极大的压缩程度,而且在测试数据集上表现出高度的有效性和能用性。