Oct, 2023

对话问答模型的强化重述生成之稳健训练

TL;DR通过我们提出的REIGN框架,我们通过多种步骤来解决面对表面形式变化的局限性学习环境,其中包括系统生成训练问题的改写,通过深度强化学习改善问答模型的性能,以及在一个基准测试集上训练模型并应用于另一个。我们通过大量多样的改写生成评测数据的方式对训练模型的鲁棒性进行了严格评估,结果显示,通过改写生成的训练方法的对话问答模型明显优于只使用金标准问答对进行标准训练的模型。