ACLOct, 2022

多类型对话式封闭和无法回答问题的问答生成

TL;DR本文提出了一种新的方法合成用于 CQA 的数据,其中包括开放式,封闭式和无法回答的问题,通过为每种问题类型设计不同的生成流程并将它们有效地结合在单个共享框架中,同时设计了分层回答分类模块,提高了合成数据的质量,手动检查发现我们的框架生成的合成数据具有非常类似于人类生成的对话的特征,在四个领域中,使用我们的合成数据训练的 CQA 系统的表现确实接近于使用人工注释数据训练的系统。