SIGIRMar, 2024

密集检索的缩放定律

TL;DR文章研究了稠密检索模型的性能是否遵循与其他神经模型相同的缩放定律,并提出使用对比对数似然作为评估指标,并通过大量实验证明,在我们设置下,稠密检索模型的性能遵循与模型大小和注释数量相关的明确的幂律缩放。此外,文章还通过流行的数据增强方法来检验缩放效果,以评估注释质量的影响,并应用缩放定律来找到在预算限制下的最佳资源分配策略,这些研究结果对于理解稠密检索模型的缩放效应并为未来的研究提供有意义的指导具有重要意义。