BriefGPT.xyz
Ask
alpha
关键词
natural language constraints
搜索结果 - 3
自然语言约束下的安全多智能体强化学习
我们提出了一种名为 SMALL 的新方法,该方法利用经过微调的语言模型来解释和处理自由形式的文本约束,将其转化为捕捉禁止状态和行为本质的语义嵌入,并将其整合到多智能体策略学习过程中,使智能体能够学习最小化约束违规和优化奖励的策略。在多个环境
→
PDF
a month ago
使用自由形式的自然语言约束和预训练语言模型的安全强化学习
利用预训练语言模型的先验知识,我们的方法可以在遵守给定约束条件的情况下,理解复杂约束并学习安全策略,而无需任何阶段的真实成本。
PDF
6 months ago
带语言约束的可控文本生成
本篇论文提出了使用自然语言指定限制条件的语言模型的文本生成任务,并创建了挑战性的基准 Cognac。我们提出了一种名为 CognacGen 的方法,旨在利用语言模型的内部知识来引导生成,它可以成功地推广到未看到的指令,并在生成符合限制的文本
→
PDF
2 years ago
Prev
Next