BriefGPT.xyz
大模型
Ask
alpha
关键词
counterfactual methods
搜索结果 - 3
大型语言模型理解逻辑还是仅仅模仿语境?
大型语言模型在逻辑推理和符号推理等复杂场景中表现出色,但其在理解逻辑规则上存在限制,本文通过反事实方法探讨了大型语言模型的推理能力,强调了加强机制以确保其可靠的逻辑推理的需求。
PDF
4 months ago
MM
优化奖励的推荐系统的离线评估:仿真案例
本文介绍了推荐系统等互动应用中在线评估方法的重要性,分析了离线评估方法的特点,提出了使用基于模拟的比较作为评估手段的优点。
PDF
2 years ago
SIGIR
建模还是干预:从用户交互中比较反事实和在线学习排序
本研究对 LTR 领域的两种方法进行了第一次直接比较。研究结果表明,这两种方法在不同实验条件下性能存在显著差异,对于选择哪一种方法,需要考虑选择偏差、位置偏差和交互噪声的程度。
PDF
5 years ago
Prev
Next