KDDJul, 2023

LEA:提升句子相似度对错别字的鲁棒性的词汇注意力偏置

TL;DR通过引入词汇感知注意力模块(LEA)来解决文本噪音问题,增强交叉编码器在具有短文本描述和有限上下文的复杂场景中应对文本噪音;在商品匹配和文本蕴含等领域中,LEA 通过考虑词汇相似性对打字错误鲁棒性进行改进,在干净数据集和包含噪音数据集上均展现出竞争力,并为交叉编码器处理打字错误的研究提供了启示。