全球安全连续学习:高效知识传递
通过使用高斯过程和非线性外部输入结构在考虑给定安全约束条件的情况下,活跃地学习时间序列模型,使用动态探索输入空间生成适用于时间序列模型学习的数据,然后通过逐步确定安全要求和过去观察结果来对输入轨迹进行参数化分析,并在技术应用中进行实证评估,结果显示我们的方法在现实技术用例中的有效性。
Feb, 2024
在这篇论文中,我们提出了一种安全学习算法,通过使用 Nadaraya-Watson 估计器而不是高斯过程,提供概率安全保证,并且在数据点数量方面实现对数级别的扩展。我们为估计结果提供了理论保证,将其嵌入到一个安全学习算法中,并在模拟的七自由度机器人操纵器上进行了数值实验。
Sep, 2023
本文提出了一种基于学习的模型预测控制方案,其可以提供可证明的高概率安全保证,并利用正态分布先验的规则性假设来构建可证明准确的置信区间,保证轨迹满足安全约束,通过终端集约束递归地保证每个迭代中存在安全控制动作。在实验中展现了该算法可以用来安全、高效地探索和学习动态系统。
Mar, 2018
该论文提出了一个新的 Interactive Machine Learning 算法,通过一个基于高斯过程先验的框架来避免不安全的决策并优化决策效率,应用到安全贝叶斯优化和安全的 deterministic Markov Decision Processes 中,实验证明该算法优于其他算法。
Oct, 2019
将健壮的高斯过程均匀误差边界扩展到多任务设置,通过后验超参数分布的马尔科夫链蒙特卡罗方法计算置信区间,应用贝叶斯优化来安全优化系统并结合模型的测量数据,仿真表明与其他最先进的安全贝叶斯优化方法相比,优化过程可以显著加速,取决于模型的准确性。
Dec, 2023
本研究针对优化未知效用函数的绝对或偏好反馈时的安全性约束问题,提出了一种有效的安全贝叶斯优化算法 StageOpt,并通过理论和临床实验验证了 StageOpt 在扩展安全区域和最大化效用函数两个阶段上的高效性和效果优于现有方法的特点。
Jun, 2018
研究在序列控制问题中的安全学习和探索问题,提出了一种深度健壮回归模型来预测安全探索的不确定性界限,证明了该方法在难以指定好的高斯过程先验的情况下优于传统的基于高斯过程的安全探索方法。
Jun, 2019