ACLMay, 2022
从预训练语言模型中提取潜在的操纵向量
Extracting Latent Steering Vectors from Pretrained Language Models
Nishant Subramani, Nivedita Suresh, Matthew E. Peters
TL;DR本研究提出一种新的控制文本生成方式,在不进行优化的情况下直接从预训练的语言模型解码器提取潜在向量。实验证明存在可用于控制的方向向量,并且可以用于 YELP 情感基准测试和文本相似性基准测试,反映句子的相似性。