BriefGPT.xyz
Ask
alpha
关键词
temporal biases
搜索结果 - 3
评估 LLMs 在时间泛化上的表现
大语言模型的发展迫切需要与语言理解和信息处理的提升相适应的评估方法。我们检查了当前的大语言模型,并揭示了它们在时间推理和偏见方面存在的各种时间偏见。我们提出了一个评估框架 Freshbench,用于动态生成最新的现实世界预测性预测的评估基准
→
PDF
2 months ago
使用机器学习注意力模型进行时间偏差校正
通过将偏差修正方法(BC)重新构想为概率模型而非算法过程,并使用先进的机器学习(ML)概率注意力模型适应 BC 任务,我们提供了一种新颖的 BC 方法来纠正时间偏差,以产生更可靠的对气候统计的影响研究。
PDF
5 months ago
EMNLP
MenatQA:用于测试大型语言模型的时间理解和推理能力的新数据集
本论文通过构建 MenatQA 来评估大型语言模型(LLMs)在时间理解和推理能力方面的表现,并测试了不同参数大小的主流 LLMs。结果表明,大多数 LLMs 在处理不同程度的时间因素时不如更小的时间推理模型,并且对时间偏差的敏感度较高,且
→
PDF
9 months ago
Prev
Next