BriefGPT.xyz
Ask
alpha
关键词
counterfactual demonstrations
搜索结果 - 2
ICML
诊断、反馈、适应:人在执行时进行策略适应的框架
本文提出一种交互式框架,利用用户反馈直接识别个性化任务无关概念生成反事实演示,用于数据增强并获得适合个性化用户目标的策略,通过在真实人类用户的离散和连续控制任务上进行实验证明了该方法有效降低了微调所需演示数量、使用户更好地了解机器人代理失败
→
PDF
a year ago
大型语言模型的上下文忠实提示
本文探讨了大型语言模型在知识获取任务中通过设计启示策略,特别是意见为基础的提示和反事实演示,有效提高了上下文的真实性,并在三个数据集上进行实验,结果表明在上下文中的忠实度有了显著提高。
PDF
a year ago
Prev
Next