Jan, 2024

COIN: 机遇约束的模仿学习用于基于不确定性感知的自适应资源超额订阅策略

TL;DR我们通过提出的新颖的机会约束模仿学习框架解决了在存在不确定性的情况下学习安全和稳健的决策策略的挑战,以提高资源效率并确保安全性。