EMNLPOct, 2022

会话式问答中的加强问句重述技术

TL;DR使用强化学习训练重写模型,以 QA 反馈作为监督信号,能够有效提高抽取式和检索式问答中的性能,并且人工评估表明该方法能够生成更准确和详细的重写,优于人工注释。