通过直接学习神经网络控制器以满足信号时间逻辑 (STL) 的要求,以确保长期机器人任务的安全性和满足时间规范的挑战。同时,采用备用策略以保证控制器故障时的安全性。该方法可以适应不同的初始条件和环境参数,并在复杂的 STL 规范任务中以 10 倍至 100 倍速度快于传统方法。
Sep, 2023
本文介绍一种基于 funnel functions 的可行强化学习算法,用于实现连续状态空间中 STL 规范的鲁棒满足,并在摆和移动机器人示例上演示了该方法的实用性。
Nov, 2022
该论文提出了一种利用近似解决 STL 综合问题的方法,通过最大化已知的效果指标来学习未知随机动态系统的最优策略,在模拟中验证了该方法的有效性。
Sep, 2016
本论文提出了一种新的基于 STL 模板的多智能体强化学习算法以指导奖励设计,实验证明相比没有 STL 指导的情况下,算法能够显著提高多智能体系统的性能和安全性。
Jun, 2023
该研究介绍了一种交互式学习方法,能够从自然语言描述中学习正确、简洁的统一信号时序逻辑公式,并使用深度 Q 学习算法确定机器人的最优控制策略。
Jul, 2022
我们提出了一种方法,结合了神经网络和 Signal Temporal Logic,用于对时间序列数据进行多类别分类,通过引入边界概念和 STL 属性,提高了分类结果的可解释性。
Feb, 2024
研究利用时序逻辑生成奖励对深度强化学习进行实时控制,并在多项复杂连续控制基准测试中证实了新模型相较于现有模型更为合适。
Dec, 2022
从观察行为中学习 Signal Temporal Logic (STL) 的要求,通过结合贝叶斯优化和信息检索技术,同时学习 STL 公式的结构和参数,提高了对于需求挖掘的有效性,进一步推动了在计算机物理系统中的研究。
May, 2024
该论文介绍了一种基于模型的方法,用于针对高度非线性环境中的自主代理训练反馈控制器。我们希望该训练策略确保代理满足以离散时间信号时序逻辑(DT-STL)表达的特定任务目标。为了解决长时间跨度任务目标的问题,我们引入了一种基于随机梯度近似算法的梯度近似算法,并提出了适用于复杂规范的 DT-STL 的新的平滑语义。
Mar, 2024
本文研究利用 Parametric Signal Temporal Logic 设计无监督的时间序列数据特征以解决数据过载问题,以实现对复杂模型和实验产生的大量数据进行自动分类。作者通过几个示例说明了这种技术如何生产可解释性的公式,适合进行分析和理解。
Dec, 2016