May, 2023

利用大型语言模型预测编辑操作来减少序列长度

TL;DR本文提出一种通过预测编辑操作集合来实现本地序列转导任务的方法,并使用指令调整来对大型语言模型进行监督学习,实验证明该方法在常见任务中具备与基线模型相当的性能,同时可将目标文本长度缩小 21%。