Oct, 2023

贝叶斯神经网络的概率式到达 - 避免

TL;DR本研究主要探讨基于模型的强化学习中的安全性和鲁棒性问题,包括使用贝叶斯神经网络描述动态模型来计算迭代预测的到达 - 避免概率,以及使用控制综合算法综合出最佳控制策略以满足安全性约束和学习到的动态模型。