BriefGPT.xyz
Ask
alpha
关键词
test collections
搜索结果 - 5
SIGIR
检索评估的合成测试集
使用大型语言模型构建综合人工合成测试集来评估信息检索系统的可行性及存在的潜在偏见风险。
PDF
2 months ago
我们能利用大型语言模型填补相关性评判空缺吗?
利用大型语言模型填补测试集中的空缺,以扩展现有的测试集合,并找出人工注释与自动注释的一致性差异,从而更好地满足人类需求的工作。
PDF
2 months ago
HC4: 用于 Ad Hoc CLIR 的新测试集
本文章介绍了一种新的用于跨语言信息检索的测试集合 HC4,并利用交互搜索和判断以及主动学习方法来构建测试集合,以评估神经 CLIR 方法的效用及提供基准结果。
PDF
2 years ago
TREC 深度学习赛道:大数据环境中可重用的测试集合
本文为支持 TREC Deep Learning 的数据重复利用,具体描述了数据集的详细情况,阐述了使用 TREC DL 数据写作论文的最佳实践方法,并对 TREC DL 数据的可重复性进行了分析。
PDF
3 years ago
大规模信息检索评估的活跃抽样
本文提出一种结合两种方法 —— 抽样和主动选择文档 —— 的大规模信息检索评估方法,其通过向系统分配分布并在评估过程中修改来减少样本偏差,并使用 TREC 数据验证其优点。
PDF
7 years ago
Prev
Next