ACLMay, 2023

WebCPM:面向中文长篇问答的交互式 Web 搜索

TL;DR介绍了 WebCPM,首个基于交互式 Web 搜索的中文长篇问答(LFQA)数据集,共收集 5,500 个高质量的问答对,开发了基于预训练语言模型微调的 LFQA 流水线,生成的答案在数据集和 DuReader 上能达到不亚于人类书写的水平。