Jun, 2024

使用 GenAI 进行重复检测

TL;DR使用最新的大型语言模型和生成式人工智能技术,在常见基准数据集上使用我们提出的方法,能够将数据去重的准确率从使用自然语言处理技术的 30% 提高到近 60%。