BriefGPT.xyz
Ask
alpha
关键词
ground-truth cost
搜索结果 - 1
使用自由形式的自然语言约束和预训练语言模型的安全强化学习
利用预训练语言模型的先验知识,我们的方法可以在遵守给定约束条件的情况下,理解复杂约束并学习安全策略,而无需任何阶段的真实成本。
PDF
6 months ago
Prev
Next