Mar, 2022

VAST:用于上下文化语言模型的情感评估语义测试

TL;DR本文提出了一种新的内在评估任务VAST,可以用来评估基于上下文的词嵌入(CWEs)的效果,研究了上下文语境、分词、语言模型等因素对CWEs的影响,并且该评估方法也可以用于7种不同的语言;通过实现对GPT-2的测试,发现通过对其中一些神经元的操作可以过滤掉更多的非语义相关的信号,从而提升词语语义相关性的相关度;最后,通过对词相似性的任务以及词汇关联偏差测试的研究表明,VAST在LM语义理解方面有很好的效果。