ACLSep, 2021

基于鉴别器引导的 MCTS 解码的受限文本生成

TL;DR本文通过指导树遍历过程中使用鉴别器推导所需的限制条件,探讨了如何在解码过程中进一步控制基于 Transformers 的大型语言模型(LM)生成的长文本,从而避免对 LM 进行微调。此方法相对于微调又更易于并且训练代价更小,同时允许更细致、更动态地应用限制条件。在评估了多种搜索和重新排序方案后,表明基于鉴别器引导的 Monte Carlo Tree Search 解码方法可以在两种限制条件和语言(法语和英语)中以最先进的效果,得到多样性鼓励下基于重新排序的其他解码方法相当好的效果。