Apr, 2024

多新闻+: 基于LLM的数据注释的成本效益的数据清洗

TL;DR利用大型语言模型的数据清洗策略,通过模拟人工注释和分类不相关文档,我们改进了Multi-News数据集,提高了数据集质量,而无需依赖昂贵的人工注释工作。