feasible set | BriefGPT - AI 论文速递

关键词feasible set

搜索结果 - 4

安全强化学习中的迭代可达性估计
确保安全对于强化学习的实际部署非常重要。我们提出了一个新的框架，用于在一般的随机环境中进行安全约束的强化学习。我们的算法在最优化奖励的同时保持持续的安全特性，通过最小化累积折扣违规行为来产生最安全的行为，并基于可达性估计来优化我们提出的框架
PDF9 months ago
一种新的计算简单的实现神经网络的方法：带有输出硬约束
提出了一种在神经网络输出值上施加硬凸约束的计算上简单的方法，通过附加神经网络层来实现对隐藏参数向量映射到约束集合中的点，并简单地扩展到对输入进行约束的情况，展示了如何将不同类型的约束集成到提出的方法中，包括线性、二次、相等和动态约束以及边界
PDFa year ago
不应使用的进化计算方法
本文描述了一种可用于识别包含中心偏差算子的方法的简单过程，并使用该方法调查了 1987 年至 2022 年间发表的 90 种进化计算方法，结果发现超过一半的方法存在中心偏差问题。研究还指出中心偏差是一个相对较新的现象，但在近几年中，它的出现
PDF2 years ago
ICML从数据中挖掘约束条件的整数线性规划框架
本文提出了一种用于从数据中挖掘约束条件的一般框架，该框架以整数线性规划问题的形式考虑结构化输出预测中的推断，然后通过估计可行集的外部和内部多面体来挖掘底层约束条件，并在各种合成和现实应用中验证了所提出的约束挖掘算法。
PDF4 years ago