Aug, 2023

神经对话模型和如何控制:失败和修复的调查

TL;DR探讨了基于强大语言模型的开放领域会话系统,从语言学角度解释了Grice的合作会话标准,并从使得贡献适切的角度系统化了相关文献:神经会话模型必须流畅、信息丰富、一致、连贯,并遵循社会规范。为了确保这些优势,近期的方法尝试通过干预数据、训练模式或解码等方面来控制底层语言模型,我们按照这些类别和干预点讨论了有前途的尝试,并为未来的研究提出了新的方向。