BriefGPT.xyz
Ask
alpha
关键词
evalrank
搜索结果 - 1
ACL
以词和句相似性重新思考评估
本文提出了 EvalRank 作为一种新的内部评估方法,它在 60 多个模型和流行数据集上进行了深入的实验,并释放了实用的评估工具包用于未来的基准测试。
PDF
2 years ago
Prev
Next