BriefGPT.xyz
Ask
alpha
关键词
benchmarking studies
搜索结果 - 3
TELeR: 用于复杂任务基准测试的 LLM 提示的通用分类
提出了一种通用分类法,以设计具有特定属性的提示来执行广泛的复杂任务,从而解决了使用不同提示类型 / 样式和提示中提供不同程度细节时 LLMs 性能差异的问题,使未来的基准研究能够报告所使用的特定类别的提示,启用对不同研究的有意义的比较,并通
→
PDF
a year ago
ACL
2020 年讽刺检测共享任务报告
研究发现,找出人们的反讽和言语讽刺对于理解他们的实际情感和信仰至关重要。因此,反讽分析已成为自然语言处理中一个热门的研究问题。本文作为 FigLang2020 会议的一部分,介绍了一个 sarcasm detection 共享任务,旨在进行
→
PDF
4 years ago
用于 AC 最优潮流算法基准测试的电网库
该研究提出了一种标准化的交流最优功率流(AC-OPF)数学公式和用于评估 AC-OPF 算法的 PGLib-OPF 网络,其中评估使用的网络、发电和负载数据可能会存在细微的差异,该研究通过提供开源的 PGLib-OPF 基准库和网络数据以期
→
PDF
5 years ago
Prev
Next