关键词claim check-worthiness detection
搜索结果 - 2
- 宣称检查价值检测:LLM 对标注指南的理解程度如何?
通过使用零 - 和少 - 次学习模型,将事实和价值评估标准直接用于提示,我们评估了 LLM 在五个不同领域的声明检测和可信度检测数据集上的预测和校准准确性,并发现最佳的提示详细程度取决于领域,提供上下文信息并不改善性能,可信度评分可以直接用 - 自动事实核查中的跨主题值得核实声明检测
本文针对不同主题下识别值得检查的权利要求的挑战进行了评估和量化,提出了 AraCWA 模型来减轻跨主题检测具有检查价值权利要求时的性能下降,该模型通过少量学习和数据增强来为新的主题提高性能,并使用公开数据集的阿拉伯语推文,为不同的主题证明了