关键词counterfactual prompting
搜索结果 - 3
- LLM 基准性能上的基准率效应:区分考试策略与基准性能
使用 MMLU 数据集,通过对空测验探究基本率概率对任务性能的影响以及如何通过反事实提示来减轻这种影响。我们提出了 Nvr-X-MMLU 任务作为 MMLU 的变种,从而消除测试能力对任务性能的混淆问题。
- 使用反事实数据处理器调整大型语言模型
探究利用反事实提示以及直接偏好优化框架来对齐模型风格的方法,该方法有效地注入了良好的行为并减轻了不理想的情况,鼓励模型忽略不合适的指令,从而以低成本的方式使大型语言模型满足对负责任和道德对齐的人工智能系统的需求。
- 文本与模式:有效思路链需要双方共同努力
本文研究了基于 chain of thought (CoT) prompting 的 few-shot 学习机制,使用反事实提示进行实验,并通过多个模型证实了 CoT 的成功不是由 pattern 的存在而来,而是其中一个目的是在输出中找到