May, 2024

基于大型语言模型的 5W1H 提取

TL;DR通过 ChatGPT,我们基于高质量的 5W1H 数据集,设计了多种从零热点 / 少热点提示到高效调优的策略,以从原始新闻文档中提取 5W1H 分面。实验结果表明,调优后的模型在我们标记的数据集上的性能优于 ChatGPT。此外,我们还探讨了源领域(如 NYT)模型在目标领域语料库(如 CNN/DailyMail)上进行 5W1H 提取任务的领域能力。