- 基于数据驱动的时态逻辑推理的开关非线性系统模型鉴别
本文研究数据驱动模型识别的问题,提出了逼近未知动态和推断未知逻辑规范的数据驱动方法,并利用基于优化的算法分析了学习 / 推断的模型 - 任务对的区别,为该集合中与新观察不一致的模型 - 任务对规定模型推断的逻辑规范的大小,以增加模型鉴别算法 - 完全可观察非确定性领域模型中的时间扩展目标识别
本文研究将目标识别扩展到具有完整可观察性和非确定性的计划领域模型中,重点是在使用线性时间逻辑(LTLf)和纯过去线性时间逻辑(PLTLf)表达的有限痕迹上识别目标。我们开发了第一种能够识别此类设置中目标的方法,并使用六个计划领域模型上的不同 - 基于折扣线性时态逻辑的政策综合和强化学习
通过降低时间折扣,将 LTL 适用于 RL 并在 Markov 决策过程中综合策略,以解决小扰动敏感性问题。
- 基于规则的 LTLf 过程规范的测量:一种基于概率的数据驱动方法
本文介绍了一种为声明性流程规范设计概率测量的框架。提出了一种测量事件日志上规范满足度的技术,并使用真实数据进行了评估,证明了它在发现、检查和漂移检测方面的适用性。
- IJCAI基于 LTL 规约的样本高效无模型强化学习及最优性保证
本研究提出一种基于强化学习的模型自由优化方法来学习行为策略,以最大化符合给定线性时态逻辑规范的概率。通过采用新型的产品 MDP、奖励结构和折扣机制,在各种 MDP 环境中进行实验,证明了其具有改进的样本效率和最优策略收敛性。
- IJCAILTL 本体中介的时间查询的逆向工程
以正线性时态逻辑 LTL 为例,研究了解决给定答案和非答案的情况下构造查询问题的相关问题,关注于设计合适的查询语言以及决策是否存在特定语言的查询来分离给定答案和非答案的复杂性,同时考虑了纯 LTL 查询和通过 LTL 本体中介的查询。
- 部分可观测环境下自主智能体复杂任务的无模型运动规划
该研究使用无模型强化学习方法解决了部分已知环境下自主智能体的运动规划问题,提出了一种基于线性时态逻辑和 Markov 决策过程的方法,并应用于无人机的实际控制中。
- 观点线性时间逻辑
本文提出了一种名为 SLTL 的新逻辑,它将 LTL 的时间特性与 SL 的多角度建模能力相结合,旨在解决多角度情境下的实践推理问题。
- 基于模型的动态屏蔽技术,用于安全高效的多智能体强化学习
该论文提出了一种基于模型的动态屏蔽(MBDS)方法来支持多智能体强化学习算法设计,同时在强化学习和部署阶段实现形式化安全性保证。该算法合成分布式屏蔽,可以在与每个 MARL 代理并行运行的情况下监视和纠正不安全行为,从而实现对多智能体复杂环 - 机器人任务规范的自然语言到线性时间逻辑翻译器的高效数据学习
本文提出一种基于学习的方法,通过算法生成 LTL 公式,并将其转换为结构化英语进而利用现代大型语言模型的改写功能来合成自然语言命令,从而减少人工数据依赖,以 75%的准确率将自然语言命令翻译成 LTL 规范,并发现该翻译的公式能够用于长视距 - 最终折扣时序逻辑反事实经验重播
通过使用可期折扣技术的价值函数代理来找到最大概率满足 LTL 规范的策略,以及通过对不同满足 LTL 规范的方法进行反事实推理来生成脱离政策的数据的新体验重演方法,该论文在离散和连续状态操作空间中进行的实验证实了反事实经验回放方法的有效性。
- 前向 LTLf 合成:DPLL 在工作
本文提出了一种新的 AND-OR 图搜索框架,用于合成有限轨迹上的线性时态逻辑(LTLf),并在框架中设计了一种基于 DPLL 算法的程序来生成特定代理 - 环境移动,同时还提出了一种基于状态公式语法等价性的搜索节点等价性检查方法,实验结果 - Lang2LTL:将自然语言命令转换为时间机器人任务规范
Lang2LTL 是一个基于大型语言模型的新型系统,能够提取自然语言指令中的相关表达并将其转化为机器人的任务规范,使任何机器人系统能够在无需额外训练的情况下解释自然语言导航命令并执行多步骤的导航任务,以 88.4% 的平均准确性在 22 个 - ASQ-IT:基于交互式解释的强化学习智能体
本文介绍了一个交互式工具 ASQ-IT,它基于 formal methods 和 automata theory,能够让用户通过查询描述感兴趣的行为的时间属性来观察代理在其环境中的行为,并帮助用户识别错误的代理行为。用户研究表明,使用 AS - 通过未来依赖选项推广 LTL 指令
本文提出了一种新的多任务 RL 算法,通过离线策略学习选项来实现任务完成的全局最优性,并通过训练基于子目标序列的多步价值函数来更有效地传递满足未来子目标的奖励,从而解决了在 RL 中学习 LTL 任务代价函数时的一些问题。实验结果表明,该方 - AAAI学习时态逻辑性质:两种最近方法概述
本文总结了两种不同的问题设置中,从正面或反面的示例中学习 LTL 公式的两种方法,第一种方法假设示例标记有噪声,第二种方法则考虑在仅给出正面示例的情况下推断有意义的 LTL 公式,所提出的方法提供了解决上述问题的不同算法,以及推断时的其他时 - 基于时间逻辑模式的面向结果的处方式过程监控
提出了一种基于结果导向的 Prescriptive Process Monitoring 系统,该系统使用线性时间逻辑来定义活动之间的时间关系,通过训练机器学习分类器来预测目标结果,并在运行时返回最显著的时间模式。
- 学习违反最小的连续控制以满足不可行的线性时间逻辑规范
本文研究了基于深度强化学习的模型无关框架来解决复杂高级任务下的连续时间控制综合问题,并提出了一种基于采样路径规划算法来满足要求的方案,旨在降低深度强化学习在解决长期任务时的局限性和探索复杂环境问题
- 安全和协安全语言的一阶逻辑特征
本文介绍了一种 FO-TLO 的片段 SafetyFO 和該兩個片段的對偶 coSafetyFO,它們在經濟安全和反應綜合方面的表現完全適合於 LTL 可定義的經濟安全和反應綜合語言,這一结果充分填補了 LTL 片段的特性的一些空白。
- 线性时态逻辑约束下的策略优化
本文研究了带线性时间逻辑约束的策略优化问题。通过使用生成模型和 LTL 语言,提出了一种基于模型的方法,用于在低样本数据情形下保证任务满足和成本最优的算法。