ACLJan, 2023

句子嵌入模型中的表示偏差

TL;DR本文研究表明,SOTA 句子转换器具有强烈的从属名词集偏差,这种偏差是在词汇和语法结构预定义的条件下得出的。此外,该研究还发现,成对句子之间的余弦相似度更受其名词成分集的重叠程度影响,而对于其他更精细的句法语义成分则不那么敏感。