BriefGPT.xyz
Ask
alpha
关键词
feasible set
搜索结果 - 4
安全强化学习中的迭代可达性估计
确保安全对于强化学习的实际部署非常重要。我们提出了一个新的框架,用于在一般的随机环境中进行安全约束的强化学习。我们的算法在最优化奖励的同时保持持续的安全特性,通过最小化累积折扣违规行为来产生最安全的行为,并基于可达性估计来优化我们提出的框架
→
PDF
9 months ago
一种新的计算简单的实现神经网络的方法:带有输出硬约束
提出了一种在神经网络输出值上施加硬凸约束的计算上简单的方法,通过附加神经网络层来实现对隐藏参数向量映射到约束集合中的点,并简单地扩展到对输入进行约束的情况,展示了如何将不同类型的约束集成到提出的方法中,包括线性、二次、相等和动态约束以及边界
→
PDF
a year ago
不应使用的进化计算方法
本文描述了一种可用于识别包含中心偏差算子的方法的简单过程,并使用该方法调查了 1987 年至 2022 年间发表的 90 种进化计算方法,结果发现超过一半的方法存在中心偏差问题。研究还指出中心偏差是一个相对较新的现象,但在近几年中,它的出现
→
PDF
2 years ago
ICML
从数据中挖掘约束条件的整数线性规划框架
本文提出了一种用于从数据中挖掘约束条件的一般框架,该框架以整数线性规划问题的形式考虑结构化输出预测中的推断,然后通过估计可行集的外部和内部多面体来挖掘底层约束条件,并在各种合成和现实应用中验证了所提出的约束挖掘算法。
PDF
4 years ago
Prev
Next