BriefGPT.xyz
Ask
alpha
关键词
experimental benchmark
搜索结果 - 2
大规模的端到端多语种事实核查
通过 Factiverse AI 模型,在超过 100 种语言中进行端到端事实核查,并通过实验基准证明,针对事实核查任务进行细化调整的模型优于大型语言模型,如 GPT-4,GPT-3.5-Turbo 和 Mistral-7b。
PDF
5 months ago
强化学习离线策略评估的实证研究
通过实验基准和实证研究,我们提供了针对强化学习中的离线策略评估(OPE)的实验基准和实证研究,重点研究了实验设计的多样性以启用 OPE 方法的应力测试。我们提供了一个完整的基准套件,以研究不同属性对方法性能的相互作用,并将结果总结为实践指南
→
PDF
5 years ago
Prev
Next