全球安全连续学习：高效知识传递

Feb, 2024

全球安全连续学习：高效知识传递

Global Safe Sequential Learning via Efficient Knowledge Transfer

Cen-You Li, Olaf Duennbier, Marc Toussaint, Barbara Rakitsch, Christoph Zimmer

TL;DR通过转移安全顺序学习，实现在给定的观测下全局探索多个不相交的安全区域，并以与传统安全学习方法相当的计算量下，以更低的数据消耗学习任务。

Abstract

sequential learning methods such as active learning and Bayesian optimization select the most informative data to learn about a task. In many medical or engineering applications, the data selection is constrained by a priori unknown safety conditions. A promissing line of →

sequential learning methods safe learning methods gaussian processes transfer safe sequential learning maximum explorable safe regions

发现论文，激发创造

基于高斯过程的安全主动学习用于时间序列建模

通过使用高斯过程和非线性外部输入结构在考虑给定安全约束条件的情况下，活跃地学习时间序列模型，使用动态探索输入空间生成适用于时间序列模型学习的数据，然后通过逐步确定安全要求和过去观察结果来对输入轨迹进行参数化分析，并在技术应用中进行实证评估，结果显示我们的方法在现实技术用例中的有效性。

Feb, 2024

高效计算的高斯过程在主动学习中的安全界限

基于自适应采样的高斯过程后验中极值中位数的可证明安全边界为活动学习提供了有效的安全约束，以便在物理系统中进行设计空间的探索。

Feb, 2024

一个计算轻量级的安全学习算法

在这篇论文中，我们提出了一种安全学习算法，通过使用 Nadaraya-Watson 估计器而不是高斯过程，提供概率安全保证，并且在数据点数量方面实现对数级别的扩展。我们为估计结果提供了理论保证，将其嵌入到一个安全学习算法中，并在模拟的七自由度机器人操纵器上进行了数值实验。

Sep, 2023

信息论安全贝叶斯优化

通过提出一种信息论安全探索准则，本研究结合贝叶斯优化采样函数，基于高斯过程推断直接识别最具信息价值的安全参数进行评估，从而实现连续领域的可行性约束优化。

Feb, 2024

基于学习的模型预测控制用于安全探索

本文提出了一种基于学习的模型预测控制方案，其可以提供可证明的高概率安全保证，并利用正态分布先验的规则性假设来构建可证明准确的置信区间，保证轨迹满足安全约束，通过终端集约束递归地保证每个迭代中存在安全控制动作。在实验中展现了该算法可以用来安全、高效地探索和学习动态系统。

Mar, 2018

交互式机器学习的安全探索

该论文提出了一个新的 Interactive Machine Learning 算法，通过一个基于高斯过程先验的框架来避免不安全的决策并优化决策效率，应用到安全贝叶斯优化和安全的 deterministic Markov Decision Processes 中，实验证明该算法优于其他算法。

Oct, 2019

安全多任务贝叶斯优化

将健壮的高斯过程均匀误差边界扩展到多任务设置，通过后验超参数分布的马尔科夫链蒙特卡罗方法计算置信区间，应用贝叶斯优化来安全优化系统并结合模型的测量数据，仿真表明与其他最先进的安全贝叶斯优化方法相比，优化过程可以显著加速，取决于模型的准确性。

Dec, 2023

阶段安全的高斯过程贝叶斯优化

本研究针对优化未知效用函数的绝对或偏好反馈时的安全性约束问题，提出了一种有效的安全贝叶斯优化算法 StageOpt，并通过理论和临床实验验证了 StageOpt 在扩展安全区域和最大化效用函数两个阶段上的高效性和效果优于现有方法的特点。

Jun, 2018

控制中的安全探索鲁棒回归

研究在序列控制问题中的安全学习和探索问题，提出了一种深度健壮回归模型来预测安全探索的不确定性界限，证明了该方法在难以指定好的高斯过程先验的情况下优于传统的基于高斯过程的安全探索方法。

Jun, 2019

高效的迭代安全验证的迁移学习

应用迁移学习提高自主安全系统的安全验证效率，并通过学习的注意力权重将以前安全验证任务的知识转移到未来任务中以改进性能。

Dec, 2020