BriefGPT.xyz
Ask
alpha
关键词
highlights
搜索结果 - 2
将政策摘要与奖励分解相结合,解释强化学习代理
本研究探讨将局部和全局解释方法相结合,通过激励分解和 HIGHLIGHTS 两种解释方式,帮助用户理解强化学习算法在决策制定时行为的策略,并通过两个用户研究证明两种方法的显著优势。
PDF
2 years ago
预训练语言生成模型的控制焦点
该研究旨在开发一种控制机制,使用户可以选择上下文的一部分作为 “亮点”,以便生成相关的输出。研究使用可训练的 “焦点向量” 来指示上下文的重要性,测试其在对话响应生成和提取式摘要生成任务中的有效性。
PDF
2 years ago
Prev
Next