BriefGPT.xyz
大模型
Ask
alpha
关键词
macro metrics
搜索结果 - 2
ACL
分类评估指标的深入研究及对常见评估实践的批判性反思
分类系统在无数篇论文中进行评估。然而,我们发现评估实践通常是模糊的。经常情况下,指标选择是没有依据的,模糊的术语容易引起误解。本文从偏倚和普遍性的直观概念出发,对常用的评估指标进行分析,考虑到论文中所表达的期望。通过对度量选择的全面理解,我
→
PDF
2 months ago
SIGIR
从信息检索角度重新思考知识图谱完成度评估
本文对知识图谱补全 (KGC) 评估方法的合理性进行了深入研究,发现现有的微观度量方法在面对大规模知识库的标注不足时存在问题,而宏观度量方法更为稳健,提出 TREC-style pooling 方法可以在考虑标注完整性的同时平衡人力成本,同
→
PDF
2 years ago
Prev
Next