COLINGSep, 2022
不要以最后一层来评估语言模型:分层注意力池化对比学习
Don't Judge a Language Model by Its Last Layer: Contrastive Learning with Layer-Wise Attention Pooling
Dongsuk Oh, Yejin Kim, Hodong Lee, H. Howie Huang, Heuiseok Lim
TL;DR该论文介绍了一种基于注意力池化策略和对比学习目标的方法,可以从预训练的语言模型中提取语言学特征和层次信号,用于下游任务,并在语义文本相似度和语义搜索任务中取得了显著提升。