Apr, 2024

多新闻 +: 基于 LLM 的数据注释的成本效益的数据清洗

TL;DR利用大型语言模型的数据清洗策略,通过模拟人工注释和分类不相关文档,我们改进了 Multi-News 数据集,提高了数据集质量,而无需依赖昂贵的人工注释工作。