BriefGPT.xyz
Ask
alpha
关键词
textual contexts and numerical domains
搜索结果 - 1
CausalBench: 大型语言模型因果学习能力的综合评估
本研究提出了一个全面的基准测试系统 CausalBench,旨在评估大型语言模型在理解因果关系方面的能力。通过包含三个与因果学习相关的任务,并结合不同难度的任务场景,该系统能够方便地比较多种大型语言模型与经典因果学习算法的性能。研究利用 C
→
PDF
3 months ago
Prev
Next