ACLMar, 2022

基于用户反馈的摘录式问答中的赌博学习模拟

TL;DR研究从用户反馈中学习抽取式问答,通过模拟反馈使用监督数据,并将问题视为情境臂学习。分析减少数据标注的几个学习场景的特征。显示最初训练的系统可通过用户反馈大幅度改进,并且可以使用现有数据集在新领域部署系统,而无需任何标注。