BriefGPT.xyz
大模型
Ask
alpha
关键词
testset slot guessing
搜索结果 - 1
现代大语言模型中数据污染问题研究
我们通过检测数据污染并提出 “Testset Slot Guessing” 方法,发现商业化的 LLM 在评估基准中有明显的性能改进,并呼吁在该领域使用更强大的评估方法和基准。
PDF
8 months ago
Prev
Next