May, 2024

面向源基数据生成的高效信息获取对话:以会议记录为案例

TL;DR结合大型语言模型与人类专业知识,通过将角色扮演代理和用户的对话模拟为大型语言模型生成,然后由人类专家验证并补充归属数据,以更高效可靠地生成数据,并构建了集中在会议记录的首个信息检索对话数据集 MISeD,其中模型在测试集、手动 WOZ 测试集和现有基于查询的摘要基准上的优越性能表明我们方法的效用。