BriefGPT.xyz
Ask
alpha
关键词
continuous setting
搜索结果 - 2
利用近似模型防护在连续环境中实现概率安全保证
本文介绍了在连续环境中实现安全强化学习的方法,使用了适用于连续环境的近似基于模型的屏蔽 (AMBS) 框架,并提出了两种新的惩罚技术来改进策略梯度的稳定收敛性。
PDF
5 months ago
IJCAI
使用数值松弛合成 Datalog 程序
本文提出了一种称为 Difflog 的技术,可以将逻辑规则从离散变量扩展到连续变量,该技术通过为 Datalog 程序的各个规则附加实值权重,自然地将数值与程序的各个结论相关联,在知识发现、形式验证和数据库查询等问题上实现学习复杂程序的显着
→
PDF
5 years ago
Prev
Next