ACLJun, 2019

学习压缩句子表示,用于设备端文本处理

TL;DR本文提出了四种连续和通用句子嵌入二值化方法,并评估了它们在多种下游任务中的表现,发现二值化句子嵌入相对于连续嵌入仅降低了约 2%的性能,同时减少了 98%的存储需求,而学习到的二进制表示形式可以通过简单计算其汉明距离来评估两个句子之间的语义相关性,这比计算连续嵌入之间的内积更加计算高效。