BriefGPT.xyz
Ask
alpha
关键词
benchmark environment
搜索结果 - 2
通过实时性能分析来更好理解和配置 MaxSAT 局部搜索求解器
本文介绍了一种使用经验累积分布函数来比较 MaxSAT 局部搜索求解器在多个问题实例和不同时间预算下的任意时刻性能的方法,实证评估结果显示求解器的性能存在差异,并且在不同的运行时间下求解器的优势和劣势会有所调整,同时,这项工作还证明了以任意
→
PDF
4 months ago
EMNLP
TURINGBENCH: 面向神经文本生成时代的图灵测试基准环境
该研究提出了 TuringBench 基准环境,旨在解决神经文本生成方法的 “图灵测试” 问题,它包括 200K 个人工或机器生成的样本数据集,分别涵盖 20 个标签,以及两个基准测试任务和网站排行榜,研究初步实验表明,FAIR_wmt20
→
PDF
3 years ago
Prev
Next